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VERFAHREN ZUR FErJTaTXVE* HERETO SCHWEFEt^TZOER 
FEINCHEMIKALIEN (METY) 
Reschreibung 

Gegenatand derErfindung istein V erfahren zurfermentativen Herstellungvon sehwefeihaltigen 
FeincbemikaiienJnsbesorrtemL^emion^^ 

ein O-Acetyl-Homosenn-Suifnydrolaae <me.Y*3en k<x.ierende Nukieobdaeguenz expnmier. 
wird. 

QtanH Her Technik 

Schwefelhaitige Feinchemikalien. wie zum Beispie. Melhionin. Homocystein. S-Menosyl- 

seipmzease in Zeiien nergeste.it und women in vieien irvtuetnezweigen van»anda, 
J da, Nabrungsmidei, FuttermittaK Koan»«k- und pbarmezeutiseben .ndustne. D«sa Sub- 
s*nzen dia zusammen ate "schwefeinaitige Feinchemikalien- bezeicbne, warden, umfessen 
organische Saumn, sowohi proteinogene ale auch nicht-proteinogene Aminosauren Wanana 
3~n. ibra Produk«on erfolg, an, zwacKn.aiga.an in, 

von Baktenen. dia entwickeltwurdan. um gmOe Mengen darjaweiia gewunecbten Subsfcnzzu 
produziaran und sezemieren. F0rdiesanZwackbaaondarsgaaigna te OrBan Km ana«,dcorvna. 
forme Bokterien, gram-posilive nieht-pathogene Baktenen. 

' Es is, bekannt, daas AminosSuren dumb Fermentation von Stammen corynetomrer Baktenen. 
^ndereco^e b ao,e ri umgiu te m,oum.bergaa te . 1 tw 

Teln felntationstechniscne Malinahmen. wie zum Beispie. Ruhrung und Vemorgung nat 
5 SaZL oderdleZusamn^nse^ngderNabmnedien.wiezumBeispie.dieZuoked^nzenae. 
L32d dar Ferment, oderd* A—ngzum Produk, . beiapia.waisa dumb k.na- 
nlluaobcraoma.ograpbie.odardieinMnaiacbenLeistungaeiganacbafteno^ 
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mus selbst betreffen. 



Obar Stammselektion aind eine Relhe von Mutantenatammen entwickalt woman, d,e e,n Sort- 
man, wonschenswerter Verbindungen aus der Reibe der schwe,e,he«igen """^^ 

Pmduktion einas bestimmten MolekOls warden Metboden der Mutagenese, Se.ek.ion und Mut- 
antenauswahlangewendet Dies istjedc^ ein zeitaulwendigesun^ 

oiese Weise erhalt man Z.B. Stamme, die resistent gagan Antimetabolite, wie z. B. die Methio- 
nin-Analoga a-Methyl-Methionin, Ethionin. Norieuoin, N-Aoetyinorteucin. S-Tnfluoromethyi- 
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homocystein, 2-Amino-5-heprenoitsaure, Seleno-Methionin, Methioninsulfoximin, Methoxin, 1- 
Aminocyclopentan-Carboxylsaure oder auxotroph fur regulatorisch bedeutsame Metabolite sind 
und schwefelhaltige Feinchemikalien, wie z. B. L-Methionin, produzieren. 

Seit einigen Jahren werden ebenfalls Methoden der rekombinanten DNA-Technik zur Stamm- 
verbesserung von L-Aminosaure produzierender Stamme von Corynebacterium eingesetzt, in- 
dem man einzelne Aminosaure-Biosynthesegene amplifizierl und die Auswirkung auf die Amino- 
saure-Produktion untersucht 

Die WO-A-02/18613 beschreibt die Nukleinsaure- und Aminosauresequenz fQr metY aus C. 
glutamicum und dessen Verwendung zur Herstellung von L-Lysin. 

Kurze Beschreibunq der Erfindunq 

Der Erfindung lag die Aufgabe zugrunde, ein neues Verfahren zur verbesserten fermentativen 
Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, bereitzustellen. 

Gelost wird obige Aufgabe durch Bereitstellung eines Verfahrens zur fermentativen Herstellung 
einerschwefelhaltigen Feinchemikalie, umfassend die Expression einer heterologen Nukleotid- 
sequenz, welche fQr ein Protein mit metY-Aktivitat kodiert, in einem coryneformen Bakterium. 

Ein erster Gegenstand der Erfindung ist Verfahren zur fermentativen Herstellung wenigstens 
einer schwefelhaltigen Feinchemikalie, welches folgende Schritte umfasst 

a) Fermentation einer die gewunschte schwefelhaltige Feinchemikalie produzierenden co- 
ryneformen Bakterienkultur, wobei in den coryneformen Bakterien zumindesteine hetero- 
loge Nukleotidsequenz exprimiert wird, welche fur ein Protein mit O-AcetyHHomoserin- 
Sulfhydrolase (metY) -Aktivitat kodiert; 

b) Anreicherung der schwefelhaltigen Feinchemikalie im Medium oder in den Zellen der 
Bakterien, und 

c) Isolieren der schwefelhaltigen Feinchemikalie, welche vorzugsweise L-Methionin um- 
fasst 

Vorzugsweise besitzt obige heterologe metY-kodierende Nukleotidsequenz zur metY- 
kodierenden Sequenz aus Corynebacterium glutamicum ATCC 13032 eine Sequenzhomologie 
von weniger als 100%, wie z.B. mehr als 70%, wie 75, 80, 85, 90 oder 95 %, oder weniger als 
70%. wie z.B. bis zu 60, 50, 40, 30, 20 oder 10 %. Die metY-kodierende Sequenz ist vorzugs- 
weise aus einem der folgenden Organismen von Liste I abgeleitet 
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Schizosacc frflrnmyces pombe 
ATCC: American Type Culture Collection. Rockville, MD. USA 

Oiee,,^^ 

Protein mit metY-Aktivitat kodiert. ^ ^ ... 
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und 54 Oder eine dazu homologe Aminosauresequenz, welche fur ein Protein mit metY-Aktivitat 
steht, umfasst 

Die kodierende metY-Sequenz ist vorzugsweise eine in coryneformen Bakterien replizierbare 
5 oder eine stabil in das Chromosom intregrierte DNA Oder eine RNA. 

Gemaft einer bevorzugten AusfQhrungsform wird das erfindungsgemalie Verfahren durchge- 
fOhrt, indem man 

1 0 a) einen mit einem Plasmidvektor transformierten Bakterienstamm einsetzt der wenigstens 
eine Kopie der kodierenden metY-Sequenz unter der Kontrolle regulativer Sequenzen tragt, oder 
b) einen Stamm einsetzt, in dem die kodierende metY-Sequenz in das Chromosom des 
Bakteriums integriert wurde 



Es ist weiterhin bevorzugt, die kodierende metY-Sequenz fur die Fermentation zu Qberexprimie- 



ren. 



AuBerdem kann es wQnschenswert sein. Bakterien zu fermentieren, in denen zusatzlich wenigs- 
tens ein weiteres Gen des Biosyntheseweges dergewQnschten schwefelhaltigen Feinchemikalie 
verstarict ist; und / oder 

in denen wenigstens ein Stoffwechselweg zumindest teilweise ausgeschaltet sind, der die Bil- 
dung der gewOnschten schwefelhaltigen Feinchemikalie vem'ngert 

Auaerdem kann es wQnschenswert sein, Bakterien zu fermentieren. in denen zusatzlich wenigs- 
tens ein weiteres Gen des Biosyntheseweges dergewQnschten schwefelhaltigen Feinchemikalie 
durch Stoffwechselmetabolite in seiner Aktivitat nichtin unerwQnschter Weise beeinflusst wirxl. 

GemaG einer weiteren AusfQhrungsform des erfindungsgemalien Verfahrens werden deshalb 
coryneforme Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt 



unter 



. f? e !T. fQr eine Aspartatkinase kodi erend en Gen JysC,- 

b) dem fur eine Aspartat-Semialdehyd-Dehydrogenase kodierenden Gen asd 

c) dem fQr die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierenden Gen gap, 

d) dem fQr die 3-Phosphoglycerat Kinase kodierenden Gen pgk, 

e) dem fQr die Pyruvat Carboxylase kodierenden Gen pyc, 

f) dem fQr die Triosephosphat Isomerase kodierenden Gen tpi, 
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dem fQr die Homoserin OAcetyltransferase kodierenden Gen metA. 
dem fQr die Cystathionin-gamma-Synthase kodierenden Gen metB. 
dem fQr die Cystathionin-gamma-Lyase kodierenden Gen metC. 
p dem fur die Serin-Hydroxymethyltransferase kodierenden Gen glyA. 
k) dem fur die Methionin Synthase kodierenden Gen metH. 
0 dem for die Methylen-Tetrahydrofolat-Reduktase kodierenden Gen. metF 
dem fQr die Phosphoserin-Aminotransferase kodierenden Gen serC 
dem fQr die Phosphoserin-Phosphatase kodierenden Gen serB. 

■ . _^J MM /^AV% AtieC 



g) 

h) 
i) 

j) 



m) 
n) 



o) dem fQr die Serine Acetyl-Transferase kodierenden Gen cysE. 
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dem Tur aie oeutre rw^j» - 

dem fur die Homoserin-Dehydrogenase kodierenden Gen horn. 
Qberexprimiert ist 

Gemaae*eranderenAus~ 

me Bakterien fermentiert. in denen g.eichzeitig wenigstens eines der Gene ausgewahit unter 
O enenTe oben genannten Gruppe a) bis p, mutiert is, so dass die korrespondterenden ^ 
^100 mU nicht mutierten Proteinen. in geringerem Mafce oder nicht durch Stoffwec^ 

Produktion der Feinchemikalie nicht beeintrachtigt wird. 

Gem^eineranderenAusfQhmngsformdesemndungsgem.OenVeriahrenswe 

Te BakteHen fermentiert. in denen gieichzeitig wenigstens eines der Gene, ausgewahit unter 

q) dem fQr die Homoserine-Kinase kodierenden Gen thrB. 

r) dem fQr die Threonin Dehydratase kodierenden Gen ilvA. 

S ) dem fQr die Threonin Synthase kodierenden Gen thrC 

t) dem fur die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 

u) dem fQr die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck. 

V ) dem fQr die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pg.. 

w) dem fQr die Pyruvat-Oxidase kodierenden Gen poxB. 

x) dem fQr die Dihydrodipicoiinat Synthase kodiernden Gen dapA. 

y) dem fQr die Dihydrodipicoiinat Reduktase kodiernden Gen dapB; oder 

z) dem fur die Diaminopicolinat Decarboxylase kodiernden Gen lysA 
abschwa^nsbesondere durch 

--r-. r - — — - .. ■ — — " 3e ~ • 

Gens. 

Qem8Be inerande re nAusf0hmngsf O ^ 

ert.indenengleichzeiUgwen^nseinesderGenederob^nG^pen 
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q) bis z) mutiert ist, so dass die enzymatische Aktivitat des korrespondierenden Proteins teilwei- 
se oder vollstandig verringert wird. 

Vorzugsweise werden in dem erfindungsgemaBen Verfahren Mikroorganismen der Art Coryne- 
bacterium glutamicurn eingesetzt 

Ein weiterer Gegenstand der Erfindung betrifft ein Verfahren zur Herstellung eines L-Methionin- 
haltigen Tierfuttermittel-Additivs aus Fermentationsbruhen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden Mikroorganis- 
mus in einem Fermentationsmedium; 

b) Entfernung von Wasser aus der L-Methionin haltigen Fermentationsbruhe; 

c) Entfernung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
von 0 bis 100 Gew.-%; und 

d) Trocknung der gemali b) und/oder c) erhaltenen Fermentationsbruhe, urn das 
TierfutternYrttel-Additiv in der gewunschten Pulver- oder Granulatform zu erhalten. 

Gegenstand der Erfindung sind ebenfaJIs die erstmalig aus obigen Mikroorganismen isoiierten 
kodierenden metY-Sequenzen, die davon kodierten O-Acetyl-Homoserin-Sulfhydrolasen sowie 
die funktionalen Homologen dieser Polynukleotide bzw. Proteine. 

Detaillierte Beschreibuna der Erfindung 

a) Allgemeine Begriffe 

AJs Proteine mit der Aktivitat der O-Acetyl-Homoserin Sulfhydrolase auch metY (EC 4.2.99.10) 
genannt, werden solche Proteine beschrieben, die in der Lage sind O-Acetyl-Homoserin und 
Sulfid unterVerwendung des Cofaktors Pyrodoxal-Phosphatzu Homocystein umzusetzen. Der 
Fachmann unterscheidet die Aktivivat der O-Acetyf-Homoserin Sulfhydrolase von der O- 
Succinyl-Homoserin-Sulfhydrolase auch metZ genannt In dem letztgenannten Enzym dient O- 
Succinyl-Homoserin und nicht O-Acetyl-Homoserin als Substrat der Reaktion. Der Fachmann 
kann die enzymatische Aktivivtat von metY durch Enzymtests nachweisen, Vorschriften dafur 
konnen sein: Shimizu H. Yamagata S. Masui R. Inoue Y. Shibata T. Yokoyama S. Kuramitsu S. 
Iwama T. Biochimica et Biophysica Acta. 1 549(1 ):61 -72, 2001, Yamagata S. Isaji M. Nakamura 
K. Fujisaki S. Doi K. Bawden S. D f Andrea R. Applied Microbiology & Biotechnology. 42(1):92-9, 
1994 
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lm Rahmen der vodiegenden Erflndung umfasst der Begrtf. .schwefeihaidge 

l^e chemische Verbindung. die wenigstens ein Schwefeiatom kovaien. gebunden enttu* 

'ItrcH ein emndungsgemsaes Fennen^n^ahrens zugangiich ist N**£££ 
Beispiete da«r s.nd Methionin. Homocyatein, S-Adenosyl-Methionin. msbesondere Ma.hK.n.n. 
und S-Adenosyl-Methionin. 

Im Rahmen der vodiegenden Erfndung umfessen dfe Begdffe .L-Ma«on.n- .MeWonin- Ho- 
■nocystein und S-Adenosyimethionin auch die korrespondierenden Seize. w,e z. B. Me«h.on.n 
Hydrochlorid oder Methionin-Sulfat 

-Poiynukieobde- bezeichne.lm acinar, Poiynbonukieobde (RNA)und 
handeln kann. 

Un t ar-Po>ypa P Udan-va re .ah l manar«nd U n,aga m a IS Pap M aodar P rote i ne.dia^.odarn^ 
Ober Peptldbindungen verbundene Aminosauren enthalten. 

Der Begriff .S.o«wechse.me.abo.r bezeicbne. chemische Verbindungen. die im Stoff*a=hae4 

vlnoXmenais*^ 

I — auch moduiierende W,*ung auf Enzyme und ihre kataiybsche 

haban kdnnen. Dabei is. aua der LHeratur bekann, daaa seiche 
ZLu hemmend eis auch stimuiierend au, die AJ«vKa, von Enzymen waken konnen B oche- 
X sbver.Lube* 1» W. H. Freeman . Company. New York. NewYortc). in derU.era.ur 
2 clschdeben. daae ea mogiich m durch Maanahmen wie Mutauon der genom^chen 
DNAdurch UV-Sbahiung. ionisierender Strahiung coer mutagen. Subste.nze.und nadhWgen- 
aeTseieKbon auf besbmmte Phanotypen in Organismen aoiche Enzyme zu produz«ren. ,n de- 

Graaf AA Bioioflica. Chemistry 381(9-10) :8 99-910, 2000; Eikmanns BJ. Eggefng L. Sahm a 
^ietn Leeuwenhoek. 64:145-63. 1 993*4). Dieseveranderten Eigenschaften kOnnen eu* 
geTeite Maiinahmen erreich. warden. Dabei is. dem Fachmann bekann,, daaa tn Genan 

I^ndaaauaderexpdmiaKenDNA.Sat.uenz^rand.P^^be^^ 
E^enschaften aurweist so zum Beispiei. dass die moduiierende Wirkung von Stofrwechseime. 
taboliten gegenOber dem nicht verSnderten Protein verander* .st 

'' Enzyme kdnnen derar. in ihrer AkUviU. beeinfluMweroen. dasa as zu einar Vemngemrvg der 
ReZnsgeschwindigkei.. oderzu einerVeranderung derAffinita.gegenOberdem Subsbato- 
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der zu einer Anderung der Reaktionsgeschwindigkeiten kommt 

Die Begriffe "exprimieren" bzw. "Verstarkung" oder B Oberexpression" beschreiben im Kontext der 
Erfindung die Produktion bzw. Erhohung der intrazellularen Aktivitat eines oder mehrerer Enzy- 
me in einem Mikroorganismus, die durch die entsprechende DNA kodiert werden. Dazu kann 
man beispielsweise ein Gen in einen Organismus einbringen, ein vorhandenes Gen durch ein 
anderes Gen ersetzen, die Kopienzahl des Gens bzw. der Gene erhohen, einen starken Promo- 
tor verwenden oder ein Gen verwenden, das fur ein entsprechendes Enzym mit einer hohen 
Aktivitat kodiert und man kann gegebenenfalls diese MaRnahmen kombinieren. 

b) ErfindungsgemaBe metY-Proteine 

Erfindungsgemaft mit umfasst sind ebenfalls ..funktionale Aquivalente" der konkret offenbarten 
metY-Enzyme aus Organismen obiger Uste I. 

..Funktionale Aquivalente" oder Analoga der konkret offenbarten Polypeptide sind im Rahmen 
der vorliegenden Erfindung davon verschiedene Polypeptide, welche weiterhin die gewunschte 
biologische Aktivitat wie z.B. Substratspezifitat, besitzen. 

Unter "funktionalen Aquivalenten" versteht man erfindungsgemaft insbesondere Mutanten, wel- 
che in wenigstens einer der oben genannten Sequenzpositionen eine andere als die konkret 
genannte Aminosaure aufweisen aber trotzdem eine der oben genannten biologische Aktivitaten 
besitzen. "Funktionale Aquivalente" umfassen somit die durch eine oder mehrere Aminosaure- 
Additionen, -Substitutionen, -Deletionen und/oder -Inversionen erhalOichen Mutanten, wobei die 
genannten Veranderungen in jeglicher Sequenzposition auftreten konnen, solange siezu einer 
MutantemitdemerfindungsgemaBen Eigenschaftsprofil fuhren. Funktionale Aquivalenzist ins- 
besondere auch dann gegeben, wenn die Reaktivitatsmusterzwischen Mutante und unverander- 
tem Polypeptid qualitativ Gbereinstimmen, d.h. beispielsweise gleiche Substrate mit unterschied- 
licher Geschwindigkeit umgesetzt werden. 

"Funktionale Aquivalente" umfassen naturlich auch Polypeptide welche aus anderen Organis- 
men zuganglich sind, sowie naturlich vorkommende Varianten. Beispielsweise lassen sich durch 
Sequenzvergleich Bereiche homologer Sequenzregionen festlegen und in Anlehnung an die 
konkreten Vorgaben der Erfindung aquivalente Enzyme ermitteln. 

w Funktionale Aquivalente" umfassen ebenfalls Fragmente, vorzugsweise einzelne Domanen o- 
der Sequenzmotive, der erfindungsgemalien Polypeptide, welche z.B. die gewunschte biologi- 
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sche Funktion aufweisen. 



den. 

Erfindungsgan** mtt umfasste ^nkbonate/^v vwzuosw eisa wankjs- 

barte „ Protei nen. Diasa basttzsn wan.ga.ana » ^ iB . go*. 95% adar 

tens etwa 60 %. 65%, 70%. adar75% ,ns «-~"£^ hw ^ nrt d„ A^mhmus 

1 5 von Pearson und Lipman, rroc. in*. 

Hon^ads^ndungsgan^^^^ 

20 der Antagonist derProtein-Aktlvitatw.net 

H.n.ogadeaa.ndangagan^n^ 

von MuUntan, w* ,B. ^T^'^Ze Mutaganasa - Nukleinsflure- 
vanaglarta Bank van Prata.n-Vanantan durch komtt Gemlscne s synthattschar 

25 ^rtt^n^d^urHa^^vonBankanpo^^ 
O.igonuk.aoWa.^gib.a.naV.a.zahW^Varfa^ ^ ^ ^ 

Hamotogar aus ainar daganartartan "■"^"^ In ainam DNA-Syn.hasaauttma.an 
che m,scha Synthasa a^daganadartan en Expressiwl8 . 

CurchgafQhn cardan, und das syntt.at.scha Gan emlSgl ich.dia BmM* 

30 v—r*<— °* r^^TSI gasman Satzan po.antta»an **■ 
lun g samtlichar Saquanzan ,n a,nam Gam.soh d « ollgonuk laottda sind dam Fach- 

ma nn bakann.(Z.B. Narang. SA (19 83)Tatra ^ Res 

chem . 53:323: Itakura a. a... (1984) Scanca 198.1056. 
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Zusatzlich konnen Banken von Fragmenten des Protein-Codons verwendet werden, urn eine 
variegierte Population von Protein-Fragmenten zum Screening und zuranschfieftenden Selekti- 
on von Homologen eines erfindungsgemalien Proteins zu erzeugen. Bei einer AusfQhrungsform 
kann eine Bank von kodierenden Sequenzfragmenten durch Behandeln eines doppelstrangigen 
5 PCR-Fragmentes einer kodierenden Sequenz mit einer Nuklease unter Bedingungen, unter de- 
nen ein Nicking nur etwa einmal pro MolekQI erfolgt, Denaturieren der doppelstrangigen DNA, 
Renaturieren der DNA unter Bildung doppelstrangiger DNA, die Sense-/Antisense-Paare von 
verschiedenen genickten Produkten umfassen kann. Entfemen einzelstrangiger Abschnitte aus 
neu gebildeten Duplices durch Behandlung mit S1-Nuclease und Ligieren der resultierenden 
1 0 Fragmentbank in einen Expressionsvektor erzeugt werden. Durch dieses Verfahren kann eine 
Expressionsbank hergeleitet werden. die N-terminale. C-terminale und interne Fragmente mit 
verschiedenen GrofJen des erfidungsgemaften Proteins kodiert 

Im Stand der Technik sind mehrere Techniken zum Screening von Genprodukten kombinatori- 
1 5 scher Banken, die durch Punktmutationen Oder VerkQrzung hergestellt worden sind, und zum 
Screening von cDNA-Banken auf Genprodukte mit einer ausgewahlten Eigenschaft bekannt 
Diese Techniken lassen sich an das schnelle Screening der Genbanken anpassen, die durch 
kombinatorische Mutagenese erfindungsgemafter Homologer erzeugt worden sind. Die am hau- 
figsten verwendeten Techniken zum Screening grofter Genbanken, die einer Analyse mit hohem 
20 Durchsatz unteriiegen. umfassen das Klonieren der Genbank in replizierbare Expressionsvekto- 
ren, Transformieren der geeigneten Zellen mit der resultierenden Vektorenbank und Exprimieren 
der kombinatorischen Gene unter Bedingungen, unter denen der Nachweis der gewOnschten 
Aktivitat die Isolation des Vektors. der das Gen codiert. dessen Produkt nachgewiesen wurde, 
erleichtert Recursive-Ensemble-Mutagenese (REM), eine Technik, die die Haufigkeitfunkttonel^ 
25 ler Mutanten in den Banken vergr6fiert. kann in KombinaOon mit den Screeningtests verwendet 
werden, urn Homologe zu identifizieren (Arkin und Yourvan (1992) PNAS 89:781 1 -7815; Delgra- 
ve et al. (1993) Protein Engineering 6(3):327-331 



c) Erfindunasqemafte Polvnukleotide 



Gegenstand der Erfindung sind ebenso Nukleinsauresequenzen (einzel- und doppelstrangige 
DNA- und RNA-Sequenzen. wie z.B. cDNA und mRNA), kodierend fOr eines der obigen metY- 
Enzyme und deren funktionalen Aquivalenten, welche z.B. auch unter Verwendung kOnstlicher 
Nukleotidanaloga zug§nglich sind. 

Die Erfindung betrifftsowohl isolierte Nukleinsauremolekule, welche fur erfindungsgemalie Po- 
lypeptide bzw. Proteine oder biologisch aktive Abschnitte da von kodieren, sowie Nukleinsaure- 
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, Hvbridisierungssonden oder Primer zur Wentifizierung 

^ente. die ,B. zurVerwendu NuWeins ,uren ver.endetwerden R5n- 

oder AmpHfizierung von erfmdungsgemalier kodieren 

nen. 

3'- und/odar 5M=nde dea Kodieren Ganbare,cha anthaHen 

der natOtfchen Que,* der ""T^ ^T- *-* -Ko^" te ™* 
es chemisch synthetisiert wird. 

mem . die rur MM rt ^ Sonden bzw. Rimer un^ssengev^nHcheinen 

pen and Organia m en verwerrfbarsa* Sofche S°"d- mimiestenselwa 12, vo^ge- 

20 - NuHeoWseguen^re^^ 

Antisense-Stranges hybridisiert 
25 We^ernadangeger^^^ 

schelden sich davon dU ^ Md ^ U ,^ polypeptide dem gewanschten Bgenachaftspn*. 
rarNuK.eottda.Kod.aranaberwe^toP^ ^ „ ,„ mindestens e ^a 50%. 55%. 

990/ o der Sequenzpositionen identisch smd. 

Nukleinsauresequenzen, die sogenannte stumme 
Erfndungagemaa — sind ^^^^Z e-na spez«e»en U^prungs-oder 
MutaUonen umfassan odar entsprechend der ' ebens o w* 

35 W^ar^a^e^.^^ 



WO 2004/024933 

PCT/EP2003/009453 

12 

wind durch eine Aminosaure gteicher Ladung, Grofie, Polaritat und/oder Loslichkeft ersetzt) er- 
haltliche Sequenzen. 
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Gegenstand der Erfindung sind auch die durch Sequenzpolymorphismen von den konkret offen- 
barten Nukleinsauren abgeleiteten MolekQIe. Diese genetischen Polymorphismen konnen zwi- 
schen lnd.viduen innerhalb einer Population aufgrund der natQrlichen Variation existieren Diese 
naturl.chen Variationen bewirken Qblicherweise eine Varianz von 1 bis 5 % in der Nukleottdse- 
quenz eines Gens. 

Weiterhin umfasst die Erfindung auch Nukleinsauresequenzen. welchen mitoben genannten 
kod,erenden Sequenzen hybridisieren oder dazu komplementarsind. Diese Poiynukteotide las- 
sen sich bei Durchmusterung von genomischen oder cDNA-Banken auffinden und gegebenen- 
fa/ls daraus mit geeigneten Primem mittels PCR vermehren und anschlieBend beispielswe.se 
mrt geeigneten Sonden isolieren. Eine weitere Moglichkeit bietet die Transformation geeigneter 
Mikroorganismen mit erfindungsgemaBen PoJynukleotiden oderVektoren, die Vermehrung der 
Mikroorganismen und damit der Poiynukteotide und deren anschliefiende Isolierung DarQber 
h.naus kdnnen erfindungsgemaBe Polynukleotide auch auf chemischem Wege synthetisiert 
werden. 

UnterderEigenschaft. an Poiynukteotide .hybridisieren" zu konnen, verstehtman dieFahigkeit 
e,nes Poly- oder Oligonukleotids unterstringenten Bedingungen an eine nahezu komptementare 
Sequenz zu binden, wahrend unter diesen Bedingungen unspezlfische Bindungen zwischen 
mcht-komplementaren Partnem unterbleiben. Dazu sollten die Sequenzen zu 70-100% vor- 
zugsweise zu 90-100%. komplementar sein. Die Eigenschaft komplementarer Sequenzen' spe- 
zrfisch aneinander binden zu konnen. macht man sich beispielsweise in der Northern- oderSou- 
them-Blot-Technik oder bei der Primerbindung in PCR oder RT-PCR zunutze. Qblicherweise 
werden dazu Oligonukleotide ab einerLange von 30 Basenpaaren eingesefet Unterstringenten 
Bedingungen versteht man beispielsweise in der Northem-Blot-Technik die Verwendung einer 
50-70 °C, vorzugsweise 60-65 °C warmen Waschl6sung, beispielsweise O.lxSSC-Puffermit 
0,1% SDS (20x SSC: 3M NaCI. 0.3M Na-Citrat. pH 7,0) zur Elution unspezifisch hybridisierter 
cDNA-Sonden oder Oligonukleotide. Dabei bleiben, wie oben erwahnt, nur in hohem MaBe 
komptementare Nukleinsauren aneinander gebunden. Die Einstellung stringenter Bedingungen 
.stdem Fachmann bekannt und ist z:B. in Ausubel et al., Current Protocols in Molecular Biology 
John Wiley & Sons. N.Y. (1989). 6.3.1-6.3.6. beschrieben. 

c) Isolienjno der kndi&r enden mf»rv-re<»n« 
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Dle mr .as E r*ym O-Ace.yl-Horoosedn-Su.rnydro.ase Brendan me.Y Gene aus den Orga- 

W^ac.er.Oen.un.K.ooe.Bne^n^^ 
Lara * -• (c-». ^ 5M < 198)> in X - Vektore " an9ete9twurda - 

• ^^riistelinE cott kdnnen Cosmide. wie der 
Cos m idvek to rSuperCosl(W ah .et a l..19 8 7.^«^ oWa| . ufe sciences. 25, 807-818 

USA. 84: 2160-2184, ^^SSL*-**^*- 
,1 979)) ooer P UC9 (Vleira « a... 1 982. " ' rekombl „a«onsdefe.cts*>d. Bn BeW 
si* besonders seiche E. con samme.d« resins un ^.Academy 

ofS clencesUSA. 87 O^^^^Te^ "^«r<«eS^«^n 8 
) ^"anoenDNA^^me^ans*^ 

5463-5467, 1977) beschrieben ist 

„„ mit hekannten Algorithmen bzw. Sequenzanalyse- 

Programme, z. B. dem von ^ ^ ^ D(Jer ^ sc^ramm vc„ Bu«er 
Marck (Nucleic Acids Research 16 »""t« » twelden . 
(Methods ofBiochemical Analysis 39. 74-97 (1998)). 

„■ j oma seouenzen von Organismen gemall obiger Llste I 
30 Die for die me.Y-Gene Kod,arenden gemaa SEQ 1D hoc. 3. 5. 7. 9. 11 . 

„ ur den gefunden. .nsbesondere wurder Segue 9 ^ ^ gefun<Jen 

«. 15. 17. 19, 21. 23. 25. 27. 29, mitdeno * nb e^benenMe.hc- 
Welterhin wurde aus dlesen vor,«gende abgelei(et Durcn sEQ ID NO:2. 4. 
dendieArnmosauresequenzenderentsprechend 42 , 44, 46. 48, 50, 52 und 54 

35 6. 8. 10. 12, 14. 16. 18. 20. 22. 24. 26. 28. 30^2 dargestellt 
sind die sich ergebenden Aminosauresequenzen der melY 
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Kodierende DNA-Sequenzen. die sich aus den Sequenzen gemali SEQ ID NO:1. 3, 5, 7, 9, 1 1 
13. 15. 17. 19. 21. 23. 25. 27. 29. 31. 33. 35. 37. 39. 41.43.45. 47. 49. 51 und 53 du'rch die Do^ 
generation des genetischen Kodes ergeben. sind ebenfalls Gegenstand der Erfindung. In glel- 
cher Weise sind DNA-Sequenzen. die mit diesen Sequenzen oder davon abgeleiteten Sequenz- 
teilen hybridisieren, Gegenstand der Erfindung. 



Anleitungen zur Identifizierung von DNA-Sequenzen mittels Hybridisierung findet der Fachmann 
unter anderem im Handbuch The DIG System Users Guide fOr Filter Hybridization- der Firma 
Boehringer Mannheim GmbH (Mannheim. Deutschland. 1993) und bei Liebletal. (International 
Journal of Systematic Bacteriology (1991) 41: 255-260). Anleitungen zur Amplication von DNA- 
Sequenzen mit Hilfe der Polymerase-Kettenreaktion (PCR) findet der Fachmann unteranderem 
im Handbuch von Gait Oligonukleotide synthesis: A Practical Approach (IRL Press. Ox- ford. 
UK. 1984) und bei Newton und Graham: PCR (Spektrum Akademischer Verlag. Heidelberg' 
15 Deutschland, 1994). 
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Weiterhin ist bekannt, dass Anderungen am N- und/oder C- Terminus eines Proteins dessen 
Funktion nicht wesentlich beeintrachtigen oder sogarstabilisieren kfinnen. Angaben hierzu findet 
der Fachmann unter anderem bei Ben-Bassat et al. (Journal of Bacteriology 169: 751-757 
(1 987)). bei O'Regan et al. (Gene 77: 237-251 (1 989). bei Sahin-Toth et al. (Protein Sciences 3- 
240-247 (1994)). bei Hochuli et al. (Biontechnology 6: 1321-1325 (1988)) und in bekannten 
Lehrbuchem der Genetik und Molekularbiologie. 

Aminosauresequenzen. die sich in entsprechender Weise aus den SEQ ID NO-2 4 6 8 10 12 
14. 16. 18. 20. 22. 24. 26. 28. 30. 32. 34. 36. 38. 40. 42. 44. 46. 48. 50. 52 und 54'ergeben. sind 
ebenfalls Bestandteil der Erfindung. 

d) Erfindunosaemaa ver wendete Wiffs7Pibn 

Weitere Gegenstande der Erfindung betreffen als Wirtszelle dienende Mikroorgansismen, insbe- 
sondere coryneforme Bakterien. die einen Vektor, insbesondere Pendelvektor oder Plasmidvek- 
tor. derwenigstens ein metY Gen gerfindungsgemaBer Definition tragi, enthalten oderin denen 
ein erfindungsgemalies metY Gen exprimiert bzw. verstarkt ist. 

Diese Mikroorganismen konnen schwefelhaltige Feinchemikalien. insbesondere L-Methionin. 
aus Glucose. Saccharose. Lactose. Fructose. Maltose. Melasse. Starke. Cellulose oder aus Gly- 
cerin und Ethanol herstellen. Vorzugsweise sind dies coryneforme Bakterien. insbesondere der 
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bacterium glutamicum zu nennen, die in a 
Aminosauren zu produzieren. 

• te « coryneformer Bakterien sind solche der Gattung 

Corynebacterium glutamicum ATCC 13032. 
Corynebacterium acetoglutamicum ATCC 15806, 
Corynebacterium acetoacidophi.um ATCC 13870. 
Corynebacterium thermoaminogenes FERM BP 1539. 
Corynebacterium melassecola ATCC 17965 



oder 

der Gattung Brevibacterium. wie 
1 5 Brevibacterium flavum ATCC 14067 
* Brevibacterium lactofermentum ATCC 13869 und 
Brevibacterium divaricatum ATCC 14020 zu nennen; 
.. oder davon abgeleitete Stamme. wie 

Corynebacterium glutamicum KFCC10065 
Corynebacterium glutamicum ATCC21608 
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and Technology, Japan. 
e) Durci^T^ 

Rnkterien nach Oberexpression eines 

metY Gens aus Organismen der Uste i in 
ins besondere L-Methionin, produzieren. 

u H^r Fachmann unterschiedliche Malinahmen einzeln 
ZurErzielungeinerOberexpressionkannderF— 

ode r in Kombination ergreifen. So kann d ^^^ r J^^^ss^^ 

den ,odereskanndiePmmoto,undRegu^ 

sich stromaufwarts des Strukturgens befindet. mutiertwerae 
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sionskassetten, die stromaufwarts des Strukturgens eingebaut werden. Durch induzierbare Pro- 
motoren ist es zusatzlich moglich, die Expression im Veriaufe der fermentativen L-Methionin- 
Produktion zu steigern. Durch MaftnahmenzurVeriangerungderLebensdauerdermRNAwird 
ebenfalls die Expression verbessert Weiterhin wird durch Verbinderung des Abbaus des En- 
zymproteins ebenfalls die Enzymaktivitat verstarkt. Die Gene oder Genkonstrukte k6nnen ent- 
weder in Plasmiden mit unterschiedlicher Kopienzahl vorliegen oder im Chromosom integriert 
und amplifiziert sein. Alternativ kann weiterhin eine Gberexpression der betreffenden Gene 
durch Veranderung der Medienzusammensetzung und KulturfOhrung erreicht werden. 



Anleitungen hierzu findet der Fachmann unter anderem bei Martin et al. (Biontechnology 5, 137- 
146 (1987)), bei Guerrero et al. (Gene 138, 35-11 (1994)). Tsuchiya und Morinaga 
(Bio/Technology 6. 428-430 (1 988)), bei Eikmanns et al. (Gene 1 02, 93-98 (1 991 )). in der Euro- 
paischen Patentschrift 0472869. im US Patent 4.601 ,893. beiSchwarzerund Puhler (Biotechno- 
logy 9, 84-87 (1991), bei Remscheid et al. (Applied and Environmental Microbiology 60. 126-1 32 
15 (1994). bei LaBarre etal. (Journal of Bacteriology 175. 1001-1007 (1993)), in der Patentanmel- 
dung WO 96/15246, bei Malumbres etal. (Gene 134, 15-24 (1993)). in derjapanischen Offenle- 
gungsschrift JP-A-1 0-229891, bei Jensen und Hammer (Biotechnology and Bioengineering 
58..191-195 (1998)), bei Makrides (Microbiological Reviews 60 : 512-538 (1996) und in bekann- 
ten LehrbOchem der Genetik und Molekularbiologie. 



Gegenstand der Erfindung sind deshalb auch Expressionskonstrukte, enthartend unter der ge- 
netischen Kontrolle regulatfver Nukleinsauresequenzen eine fQrein erfindungsgemSBes Poty- 
peptid kodierende Nukleinsauresequenz; sowie Vektoren. umfassend wenigstens eines dieser 
Expressionskonstrukte. Vorzugsweise umfassen solche erfindungsgema&en Konstrukte 5'- 
25 stromaufwarts von der jeweiligen kodierenden Sequenz einen Promoter und 3'-stromabwSrts 
eine Terminatorsequenz sowie gegebenenfalls weitere Obliche regulative Elemente, und zwar 
jeweils operativ verknOpft mit der kodierenden Sequenz. Unter einer B operativen VerknOpfung- 
versteht man die sequentielle Anordnung von Promoter, kodierender Sequenz. Terminator und 
gegebenenfalls weiterer regulativer Elemente derart, dass jedes der regulativen Elemente seine 
30 Funktion bei der Expression der kodierenden Sequenz bestimmungsgemaB erf Ollen kann. Bei- 
spiele for operativ verknupfbare Sequenzen sind Aktivrieungssequenzen sowie Enhancer und 
dergleichen. Weitere regulative Elemente umfassen selektierbare Marker. Amplifikationssignale. 
Replikationsursprunge und dergleichen. Geeignete regulatorische Sequenzen sind z.B. be- 
schrieben in Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic 
Press. San Diego, CA (1990). 



zu den artifiziellen Regulationssequenzen kann die natQrliche Regulationssequenz 
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u „,ha„den sein Durch genetische Veranderung kann 
vo r den, efcenUichen ""^^s^und I Expression der Gene emoh. 
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Oder emiedrig. warden. Das ^, e ^ das SUukturgen ^semert und dec natOdi- 

eswerden keinezus^en ^—^Zt. stal.dessenv^dier^Hirf.eReguia*- 

konstrukt enthallen seln. 

.„„„ ^j. die Promotoren. ddh, amy. lysC. dapA. lysA aus Co- 

0 Berspie.efQrbmuchbarePromo.orens.d.^eP e „ proTOto ^ SP02 Ostein Backus Sub- 

^ebaceriumg^micum. °™ a ^ m ?*^ L H och. James A.. UoslcK. Rtahard; ASM 
« is and «s Coses. Relays. Sonenshem. ^ patek x H . MlerobK, 
Press. D i s W c l ofCo,umbU..WasNn flt onundPa^^nnsB ^ lpp% ,ao- 

logy . 1 42 1297-309. 1996 ^nebens^od.r^era^cos-.^ ^ ^ 

1 s . .pp-tac-. laclq-. T7-. T5-. T3-, gaK -. . • Bevorzuflt tel auc h die Verwen- 

na(ter we.se in gram-nega«ven ten^dnduz^r P- 

du „g mduzterbarer Promotoren, v*e t B. Ueht un promotoren mltihre n Regula- 

20 teilhattverwendetwerden. 

Hi» nezielte Expression der Nukleinsaurese- 
Die genannten regutotodschen Seguenzen so ...en d,e £ dass das 

rsrcr^rrr=r^ 

25 und/oder uberexprimiert wird. 

n hzw Faktoren konnen dabei voraigsweise die Expression posi- 
Die regulatorischen Sequenzen bzw. Faktoren k Veret§rkun g der regulato- 

tivbeeintlussen^ erfolgen , indem starke 

ris chen Eiemente vorteiibafterwe.se au "^^^^^o****** 
30 TrenskriptionssignaiewieP^ 

auch eine Verstarkung der Transiation mogi.ch. .ndem be,s P ,eiswe. 
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• u ^rfolat durch Fusion eines geeigneten Pronators, 

Die Hersteiiung einer Express.onskassette ^^ mSK ^ einem ge- 
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Wiley & Sons. Incorporated, New York New York. PCR Methods. Gelfand. David H.. Innis. Mi- 
chael A.. Sninsky. John J. 1999. Academic Press. Incorporated. California. San Diego. .. PCR 
Cloning Protocols. Methods in Molecular Biology Ser.. Vol. 192, 2nd ed.. Humana Press, New 
Jersey. Totowa. T. Maniatis. E.F. Fritsch und J. Sambrook. Molecular Cloning: A Laboratory Ma- 
nual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1 989) sowie in T.J. Silhavy, M.L. 
Berman und L.W. Enquist. Experiments with Gene Fusions. Cold Spring Harbor Laboratory, 
Cold Spring Harbor, NY (1 984) und in Ausubel. F.M. et al., Current Protocols in Molecular Biolo^ 
gy, Greene Publishing Assoc. and Wiley Interscience (1987) beschrieben sind. 

Das rekombinante Nukleinsaurekonstrukt bzw. Genkonstrukt wird zur Expression in einem ge- 
eigneten Wirtsorganismus vorteilhafterweise in einen wirtsspezifischen Vektorinsertiert, der eine 
optimale Expression der Gene im Wirt ermSglicht Vektoren sind dem Fachmann wohl bekannt 
und konnen beispielsweise aus "Cloning Vectors" (Pouwels P. H. et al.. Hrsg. Elsevier. Amster- <B 
dam-New York-Oxford, 1985) entnommen werden. Unter Vektoren sind auBer Piasmiden auch 
alle anderen dem Fachmann bekannten Vektoren, wie beispielsweise Phagen, Transposons, IS- 
Elemente, Phasmide, Cosmide, und lineare oder zirkulare DNA zu verstehen. Diese Vektoren 
kdnnen autonom im Wirtsorganismus repliziert oder chromosomal lepliziert werden. 

Zur Verstarkung wurden erfindungsgemafie metY Gene beispielhaft mit Hilfe von episomalen 
Piasmiden uberexprimiert Als Plasmide eignen sich solche, die in coryneformen Bakterien repli- 
ziert werden. Zahlreiche bekannte Plasmidvektoren, wie z B. pZ1 (Menkel et al., Applied and 
Environmental Microbiology (1989) 64: 549-554), pEKExl (Eikmanns etal.. Gene 102: 93-98 
(1991)) oder pHS2-1 (Sonnen et al.. Gene 107: 69-74 (1991)) beruhen auf den kryptischen 
Piasmiden pHM1519, pBL1 oder pGA1 . Andere Plasmidvektoren. wie z. B. pCUK5MCS. oder 
solche, die auf pCG4 (US-A 4,489.160) oder pNG2 (Serwold-Davis etal.. FEMS Microbiology © 
Letters 66, 1 19-124 (1990)) oder pAG1 (US-A 5,158.891) beruhen. kdnnen in gleicher Weise 
verwendet werden. 



Weiterhin eignen sich auch solche Plasmidvektoren mit Hilfe derer man das Verfahren der Ge- 
30 namplifikation durch Integration in das Chromosom anwenden kann. so wie es beispielsweise 
von Remscheid etal. (Applied and Environmental Microbiology 60,126-132 (1994)) zur Duplika- 
tion bzw. Amplication des hom-thrB-Operons beschrieben wurde. Bei dieser Methode wird das 
vollstandige Gen in einen Plasmidvektor kloniert, der in einem Wirt (typischerweise E. coli). nicht 
aber in C. glutamicum reptoeren kann. Als Vektoren kommen beispielsweise pSUP301 (Simon 
et al.. Bio/ Technology 1,784-791 (1983)). pK18mob oder pK19mob (Schafer et al., Gene 
145,69-73 (1994)), Bernard etal.. Journal ofMolecular Biology. 234: 534-541 (1993)), pEM1 
(Schrumpf etal. 1991. Journal of Bacteriology 173: 4510-^516) oder pBGS8(Sprattetal.,1986. 
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Ge „e 41- 337-342) in Frage. Der MMH der das zu ampMizierende Gen MMH 

p. _ e kjjnnen durch Mutatto nen in den konespondiemnden Genen derart in Ihrer Ak«vitat 
Enzyme konnen dun* N ' derw „ sBnd ^ en Veni ^ ro n 9 derReakttons- 

64:145-63. 1993-94.) 

7 kann es fOr die Produktion von schwefe.ha.tlge Feinchemika.ien. insbesondere L- 

verstSrken. 

Se Kann fOr die MM von sehwefe.haH.ge Feinehemikalien, insteaonde,* L-Mefnionin. 

eineS Oder mehrere der foigenden <^<""™ 1 108790A2:DNA ^QNO.2 81 ). 
-oasf0relneAspartatkinasekodierendeGenlysC(EP1108^u . 

Is far eine Aspartafsemiaidehyd Dehydrogenase kodterende Gen asd (EP 1 108 

T^To^a.enyd^Pnospna, Dehydrogenase Kodiarande Gan gap (B^nns 
(,992). Jouma. of Baefenotogy 174: 6076*086). 

. das fflr die 3-Phosphoglycerat Kinase kodierende Gen pgk (Bkmanns ^ >. 

5 "I «r die Cysfanion^amma-Syn»,asa kodierende Gen me* (EP 1 108 790 A2; DNA-SEQ 
NO. 3491), 
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- das fQr die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 1 08 790 A2; DNA-SEQ NO. 
3061). 

- das fur die Serin-Hydroxymethyltransferase kodierende Gen glyA (EP 1 108 790 A2; DNA-SEQ 
NO. 1110), 

5 - das fQr die MethioninSynthase kodierende Gen metH (EP 1 108 790 A2), 

- das fQr die Methylentetrahydrofolat-Reduktase kodierende Gen metF (EP 1 108 790 A2; DNA- 
SEQ NO. 2379), 

- das fQr die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
SEQ NO. 928) 

1 0 - eines fur die Phosphoserin-Phosphatase kodierende Gen serB (EP 1 1 08 790 A2; DNA-SEQ 
NO. 334, DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 

- das fQr die Serine Acetyl-Transferase kodierende Gen cysE (EP 1 108 790 A2; DNA-SEQ NO. 
2818) 

- das fQr eine Homoserin-Dehydrogenase kodierende Gen hom (EP 1 108 790 A2; DNA-SEQ 
15 NO. 1306) 



So kann fQr die Hersteilung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin. in 
coryneformen Bakterien. vorteilhaft sein, gleichzeitig wenigstens eines der nachfolgenden Gene 
zu mufieren, so dass die korrespondierenden Proteine, verglichen mit nicht mutierten Proteinen. 
20 in geringerem MaUe oder nicht durch einen Stoffwechselmetaboliten in ihrer Aktivitat beeinflusst 
wercten: 

- das fQr eine Aspartatkinase kodierende Gen lysC (EP 1 108 790 A2; DNA-SEQ NO. 281), 

- das fur die Pyruvat Carboxylase kodierende Gen pyc (Eikmanns (1992), Journal of Bacteriology 
25 174:6076-6086), 

- das fQr die Homoserin O-Acetyltransferase kodierende Gen metA (EP 1 108 790 A2; DNA-SEQ 
NO. 725), 

- das fQr die Cystahionin-gamma-Synthase kodierende Gen metB (EP 1 1 08 790 A2; DNA-SEQ 
NO. 3491). 

30 - das fQr die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 1 08 790 A2; DNA-SEQ NO. 
3061), 

-das fQrdie Serin-Hydroxymethyltransferase kodierende Gen glyA (EPJ_108 790 A2; DNA-SEQ 
NO. 1110), 

- das fQr die Methionin Synthase kodierende Gen metH (EP 1 108 790 A2), 
-das fQr die Methylentetrahydrofolat-Reduktase kodierende Gen metF (EP 1 108 790 A2; DNA- 
SEQ NO. 2379). 

- das fur die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
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mo v*a DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 

f^fOr eine Ho m osenn-Denydrogenase kodierende Gen Hon, (EP 1 108 790 A2; DNA-SEQ 
NO. 1306) 

Weitert* kann es for die Produk«on von schwefelnaitige Feinchemikalien. insbasondera L- 
rrIn.vo rtB ^a« S a m , 2U ^ i c h2 u r Expre=3 to n bZW .Va re ^un g a^d W ^™ : 
loan „,e,Y-Geneeines odarmeh^darfclgandan Gana abzuschwacfcen. .sbesonde^de- 
ren Expression zu verringem. Oder auszuschalten: 

. d as for die Homosedne-Kinasa kodierende Gen thrB (EP 1 1 08 790 A2; ONMBC • NC ..3453, 
. m die Threonin Dehydrate kodierende Gen »vA (EP 1 108 790 A* DNA-SEQ NQ. 

Tsmr die Tbreonin SynfHase kodierende Gan ».C (EP 1 108 790 

. das for die Meso-Oiaminopimeiat D-Dahydroganasa kodierende Gan ddh (EP 1 108 790 A2. 
D I«rL7^ 

&B 1Z d^ucosa^Phosphat^son^se kodierende Gan pgi (EP 1 108 790 A2; DNA- 

™~Zb**0~- kodie re nde Gen poxB (EP 1 108 790 A2; DNA-SEQ NO 2873, 
:oLmrdtDin^d,pioo„na.Svn*asakod^daGan 

^aas'fOr die Dihyd^piooiina. Radukr.se kodiemda Gen dapB (EP 1 108 790 A* DNA-SEQ 

N ras«7dlDia m inopic^^ 
NO. 3451) 

Weiterhin kann es for die Produktion von sonwefeihaifige Fainohemikaiien Jnsbesonde^ 

IttenmatY^anainCorynefon^enBak.eriengieicbzai.igwanigstanse.nesderfo.gendanG^ 
r^u le™. dass die enzymafisehe Ak«vi«( des konespondie-anden Pn.te.ns te.iwe.se 
oder vollstSndig verringert wird: 
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- das fur die Homoserine-Kinase kodierende Gen thrB (EP 1 108 790 A2; DNA-SEQ NO. 3453) 

- das fOr die Threonin Dehydratase kodierende Gen ilvA (EP 1 108 790 A2; DNA-SEQ NO. 
2328) 

- das fOr die Threonin Synthase kodierende Gen thrC (EP 1 108 790 A2; DNA-SEQ NO. 3486) 
5 - das fOr die Meso-Diaminopimelat D-Dehydrogenase kodierende Gen ddh (EP 1 1 08 790 A2; 

DNA-SEQ NO. 3494) 

- das fOr die Phosphoenofpyruvat-Carboxykinase kodierende Gen pck (EP 1 108 790 A2; DNA- 
SEQ NO. 3157) 

- das fur die Glucose-6-Phosphat-6-lsomerase kodierende Gen pgi (EP 1 108 790 A2; DNA- 
10 SEQ NO. 950) 

- das fOr die Pyruvat-Oxidase kodierende Gen poxB (EP 1 108 790 A2; DNA-SEQ NO. 2873) 

- das fOr die Dihydrodipicolinat Synthase kodiernde Gen dapA(EP 1 1 08 790 A2; DNA-SEQ NO. 
3476) 

- das fur die DihydrodipicoJinat Reduktase kodiernde Gen dapB (EP 1 108 790 A2; DNA-SEQ 
15 NO. 3477) 

- das fOr die Diaminopicolinat Decarboxylase kodiernde Gen lysA (EP 1 108 790 A2; DNA-SEQ 
NO. 3451) 

Weiterhin kann es fOr die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
20 Methionin, vorteilhaft sein, neben der Expression bzw. Verstarkung eines erfindungsgemaBen 
metY-Gens unerwOnschte Nebenreaktionen auszuschalten (Nakayama: "Breeding of Amino 
Acid Producing Microorganisms", in: Overproduction of Microbial Products, Krumphanzl, Sikyta, 
Vanek (eds.), Academic Press, London, UK, 1982). 

25 Die erfindungsgemaft hergestellten Mikroorganismen konnen kontinuieriich oder diskontinuier- 
lich im batch- Verfahren (Satzkultivierung) oder im fed batch (Zulautverfahren) oder repeated fed 
batch Verfahren (repetitives Zulaufverfahren) zur Produktion von schwefelhaltige Feinchemika- 
lien, insbesondere L-Methionin, kultiviert werden. Eine Zusammenfassung Ober bekannte Kulti- 
vierungsmethoden ist im Lehrbuch von Chmiel (Bioprozelitechnik 1 . Einfuhrung in die Bioverfah- 

30 renstechnik (Gustav Fischer Verlag, Stuttgart, 1991)) oder im Lehrbuch von Stomas (Bioreakto- 
ren und periphere Einrichtungen (Vieweg Verlag, Braunschweig/Wiesbaden. 1994))zufinden. 

T^aszu verwenderfde "Kulturmedium hat in geeigneter Weise den AnsprOchen der jeweiligen 
Stamme zu genOgen. Beschreibungen von Kulturmedien verschiedener Mikroorganismen sind 
im Handbuch "Manual of Methods ftir General Bacteriology" der American Society fur Bacterio- 
logy (Washington D. C, USA, 1981) enthalten. 
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Diese erfindungsgemaa einseizbaren Medien umfassen gewohnlich eine oder meh^nKoh- 
^Je^S^^ 

Bevorzugte Kohlenstoffqueilen sind Zucker. wie Mono-, Di-oderPo.ysacchanda Sehrgute Koh- 
"uetien sind ba.ap1a.swe.se Giucose. Fntotose. Mannose. Ga.ac.ose. 
RtouioJe Lactose. Maltose. Saccharose. Raffinose. Starke ode, Ceiiuiose. Man kann Zucker 
al otr Komp te xe Verbindungen, wie Meiassen. Oder andere Nebenproou.de der Z^" 
RaLerung zu den Medien gaben. Es Kann auch vorte»haflsein. GenMscne verec*.edener Koh- 
^Zeln zuzugeben. Andere n,6g.iche Kohtonstorfquenen sind Ce und Feue w» z. B. 
Cr S o nenbtornena,. Erdnuaa. und KokosfeK, Fetfcauren wie , B. Pe.mHtos.ure. Sfcann- 
sau^e Oder Linolsaure, Alkohole wie z. B. Giycenn.MetnanoioderEtoano, und organrscbe Sau- 
ren wie z. B. Essigsaure oder Milcrtsaure. 

Stickstof.quei.en s.nd gewanniich organ-ache Oder anorganfeche s«cks«o^er«ndungenoder 
; Matna il. die d.ese Verbtodungan enthaten. sackstoffqueHen umfassenAinmo- 

n^Gas Oder Ammoniumsaize. wie Amrrtoniumsuifa^ A^moniun^htond. AnvtKto.urnpnospna.. 
Cnontontclrbona. Oder Ammoniumnibat, Nitrate. Hamstoff. Aminosauren Oder komptexe 

andere. Die Stickstoffquellen kdnnen einzeln oder ate Mischung verwendet werden. 

0 ' » ^msche Salzverbindungen, die in den Medien enthalten sein kennen. umfassen die Chlc- 
T:Z^loZl^ von Caictum. Magnesium. Nat*to, Kobe,, Mo*bdan. Ka U um. 
Mangan. Zink, Kupfer und Eisen 

, 5 AasScnwefeiqueiiefurdtoHeretoHur^^^ 
M^Tkennenanorganiechesch^^ 

I IZZ^Zr*^**.™™™*- SuKideabe.au^o^n.s^eSobw^Krer^ndungen. 
wie Mercaplane und Tbiole. verwendet werden. 
30 Als Phosphorqueile kdnnen Phospnoreaure, Kaiiumdihydrogenphospbatoder Dikaiiumhydro- 
genphosphat oder die entsprechenden Nabium haiUgen Sate verwendet werden. 

- cheiatbiidne^^ 

Benders geefcnete Cheiatbiidner umfassen Dihydroxypbenoie. wie Catecno. Oder Protocato- 

35 chuat, oder organische Sauren. wie Citronensaure. 

Dle erflndungsgemiu eingesetzten Fermentationsmedien entnaiten Obiicberweise auob andere 
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Wachstumsfaktoren, wie Vltamine oder WachstumsfSrderer, zu denen beispielsweise Biotin, 
Riboflavin, Thiamin, Folsaure, Nikotinsaure, Panthothenat und Pyridoxin gehSren. Wachstums- 
faktoren und Salze stammen haufig von komplexen Medienkomponenten, wie Hefeextrakt, Me- 
lassen, Maisquellwasser und dergteichen. Dem Kulturmedium konnen Oberdies geeignete Vor- 
5 stufen zugesetzt werden. Die genaue Zusammensetzung der Medienverbindungen hangt stark 
vom jeweiligen Experiment ab und wird fur jeden spezifischen Fall individuell entschieden. In- 
formation Ober die Medienoptimierung ist erhaKlich aus dem Lehrbuch "Applied Microbiol. Physi- 
ology, A Practical Approach" (Hrsg. P.M. Rhodes, P.F. Stanbury, IRL Press (1997) S. 53-73, 
ISBN 0 19 963577 3). Wachstumsmedien lassen sich auch von kommerziellen Anbietem bezie- 
1 0 hen, wie Standard 1 (Merck) oder BHI (Brain heart infusion, DIFCO) und dergleichen. 

Samtliche Medienkomponenten werden, entweder durch Hitze (20 min bei 1 ,5 bar und 121°C) 
oder durch Sterilfiltration. sterilisiert Die Komponenten kdnnen entweder zusammen oder noti- 
genfalls getrennt sterilisiert werden. Samtliche Medienkomponenten konnen zu Beginn der An- 
1 5 zucht zugegen sein oder wahlfrei kontinuierfich oder chargenweise hinzugegeben werden. 

Die Temperatur der Kultur liegt normalerweise zwischen 15°C und 45°C. vorzugsweise bei 25 P C 
bis 40°C und kann wahrend des Experimentes konstant gehalten oder verandert werden. Der 
pH-Wert des Mediums sollte im Bereich von 5 bis 8,5, vorzugsweise urn 7,0 liegen. DerpH-Wert 

20 fQr die Anzucht laBt sich wahrend der Anzucht durch Zugabe von basische Verbindungen wie 
Natriumhydroxid, Kaliumhydroxid, Ammoniak bzw. Ammoniakwasser odersaure Verbindungen 
wie Phosphorsaure oder Schwefelsaure kontrollieren. Zur Kontrolle der Schaumentwicklung 
konnen Antischaummitte.l wie z. B. Fettsaurepolygrykolester, eingesetzt werden. Zur Aufrechter- 
haltung der Stabilitat von Plasmiden kSnnen dem Medium geeignete selektiv wirkende Stoffe, 

25 wie z B. Antibiotika, hinzugefQgt werden. Urn aerobe Bedingungen aufrechtzuerhalten, werden 
Sauerstoff oder Sauerstoff haltige Gasmischungen. wiez. B. Umgebungsluft, indieKuttureinge- 
tragen. Die Temperatur der Kultur liegt normalerweise bei 20°C bis 45°C. Die Kultur wird solange 
fortgesetzt, bis sich ein Maximum des gewOnschten Produktes gebildet hat Dieses Ziel wird 
normalerweise innerhalb von 10 Stunden bis 160 Stunden erreichL 
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Die so erhaltenen, insbesondere L-Methionin enthaltenden, Fermentationsbruhen haben 
ublicherweise eine Trockenmasse von 7,5 bis 25 Gew.-%. 

Vorteilhaft ist aufierdem auch, wenn die Fermentation zumindest am Ende, insbesondere jedoch 
uber mindestens 30% der Fermentationsdauer zuckerlimitiert gefahren wird. Das heifct, dass 
wahrend dieser Zeit die Konzentration an verwertbaremZuckerim Fermentationsmedium auf ^0 
bis 3 g/l gehalten, beziehungsweise abgesenkt wind. 
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Die Fermentationsbruhe wird anschliefcend weiteTverarbeitet Je nach Anforderung kann die 
Biomasse ganz oder teilweise durch Separationsmethoden. wie z. B. Zentrifugation. Filtration. 
Dekantieren oder einer Kombinafon dieser Methoden aus der FermentatfonsbrQhe entfemtoder 
vollstandig in ihr belassen werden. 

Anschlieliend kann die Fermentationsbruhe mit bekannten Methoden, wie z. B. mit Hilfe eines 
Rotationsverdampfers. Dunnschichtverdampfers, Fallfilmverdampfers, durch Umkehrosmose. 
oder durch Nanof.ltration, eingedickt beziehungsweise aufkonzentriert werden. Diese aufkon- 
zentrierte FermentationsbrQhe kann anschlieliend durch Gefriertrocknung. Sprflhtrocknung. 
Spriihgranulation oder durch anderweitige Verfahren aufgearbeitet werden. 

Es ist aber auch moglich die schwefelhaltigen Feinchemikalien. insbesonder L-Methionin, welter 
aufzureinigen. Hierzu wird die produkthaltige BrQhe nach dem Abtrennen der Biomasse einer 
Chromatographie mit einem geeigneten Harz unterworfen, wobei das gewQnschte Produktoder 
die Verunreinigungen ganz oder teilweise auf dem Chromatographieharz zurQckgehalten wer- 
den. Diese Chromatographieschritte kdnnen notigenfalls wiederholt werden, wobei die gleichen 
oder andere Chromatographleharze verwendet werden. Der Facbmann ist in der Auswahl der 
geeigneten Chromatographieharze und ihrerwirksamsten Anwendung bewandert Dasgereinig- 
te Produkt kann durch Filtration oder Ultrafiltration konzentriert und bei einer Temperatur aufbe- 
wahrt werden, bei der die Stabilitat des Produktes maximal ist 

Die Identitat und Reinheit der isolierten Verbindung(en) kann durch Techniken des Standes der 
Technik bestimmt werden. Diese umfassen Hochleistungs-FIQssigkeitschromatographie (HPLC), 
spektroskopische Verfahren, Farbeverfahren, DQnnschichtchromatographie, NIRS, Enzymtest 
oder mikrobiologische Tests. Diese Analyseverfahren sind zusammengefaBt in: Patek et al. 
(1 994) Appl. Environ. Microbiol. 60:1 33-140: Malakhova et al. (1 996) Biotekhnologiya 1 1 27-32: 
und Schmidt et al. (1 998) Bioprocess Engineer. 1 9:67-70. Ulmann's Encyclopedia of Industrial 
Chemistry (1 996) Bd. A27. VCH: Weinheim, S. 89-90, S. 521-540. S. 540-547, S. 559-566, 575- 
581 und S. 581-587; Michal, G (1999) Biochemical Pathways: An Atlas of Biochemistry and Mo- 
lecular Biology, John Wiley and Sons; Fallon, A. et al. (1 987) Applications of HPLC in Bioche- 
mistry in: Laboratory Techniques in Biochemistry and Molec ular Biology. Bd. 17. ____ 

Die Erfindung wird nun anhand der folgenden nicht-limitierenden Beispiele und unter Bezug- 
nahme auf beiliegende Figuren naher beschrieben. Dabei zeigt 



Figur 1 die Plasmidkarte zu Plasmid pClysC; 
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Figur 2 die Piasmidkarte zu Plasmid pCISIysCthr311ile; 
Figur 3 die Piasmidkarte zu Plasmid pCPhsdhmetY_Mt 

Restriktionsschnittstelien mit der entsprechenden Positionsangabe in Klammem sind in den 
Plasmidkarten angegeben. Wesentliche Sequenzabschnitte sind fettgedruckt beschrieben. 
5 KanR steht fur Kanamycin-Restistenzgen; ask steht fOr Aspartatkinasegen 

Beispiel 1: Konstruktion von pCUKSMCS 

Zunachst wurden Ampicillinresistenz und Replikationsursprung des Vektors pBR322 mit den 
10 Oligonukleotiden p1.3 (SEQ ID NO:55) und p2.3 (SEQ ID NO:56) mit Hilfe der Polymerase- 
Kettenreaktion (PCR) amplifiziert 



pl.3(SEQIDNO:55) 

5'-CCCGGGATCCGCTAGCGGCGCGCCGGCCGGCCCGGTGTGAAATACCGCACAG-3* 

15 

p2.3 (SEQ ID NO:56) 

5-TCTAGACTCGAGCGGCCGCGGCCGGCCTTTAAATTGAAGACGAAAGGGCCTCG-3' 

Neben den zu pBR322 komplementaren Sequenzen, enthaltdas Oligonukleotid p1.3 (SEQ ID 
20 NO:55) in 5-3 1 Richtung die Schnittstellen fur die Restriktionsendonukleasen Smal, BamHI, Nhel 
und AscI und das Oligonukleotid p2.3 (SEQ ID NO:56) in 5-3' Richtung die Schnittstellen fur 
die Restriktionsendonukleasen Xbal, Xhol, Notl und Dral. Die PCR Reaktion wurde nach Stan- 
dardmethode wie Innis et aL (PCR Protocols. A Guide to Methods and Applications, Academic 
Press (1 990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) durchgefOhrt Das ertialte- © 
25 ne DNA Fragment mit einer Grolie von ungefahr 2,1 kb wurde mit dem GF^PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellere gerei- 
nigt Die stumpfen Enden des DNA-Fragmentes wurden mit dem Rapid DNA Ligation Kit (Roche 
Diagnostics, Mannheim) nach Angaben des Herstellers miteinander ligiert und derLigationsan- 
satz nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Manual, 
30 Cold Spring Harbor, beschrieben(1989)), in kompetente E.coli XL-1Blue (Stratagene, La Jolla, 
USA) transformiert Eine Selektion auf Plasmid tragende Zellen wurde durch das Ausplattieren 
auf Ampidinn (50Mg/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht 
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Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus QberprQft Das so 
erhaltene Plasmid erhalt den Namen pCLiKI. 
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Ausqehend vom Plasmid pWLT1 (Liebl et al.. 1992) als Template fOreine PGR Reaktion wurde 
mit den Oligonukleotiden neol (SEQ ID NO:57) und neo2 (SEQ ID NO:58) eine Kanamycin- 
Resistenzcassette amplifiziert. 

neol (SEQ ID NO:57): 

5--GAGATCTAGACCCGGGGATCCGCTAGCGGGCTGCTAAAGGAAGCGGA-3 

neo2 (SEQ ID NO:58): 
0 5-GAGAGGCGCGCCGCTAGCGTGGGCGAAGAACTCCAGCA-3* 

Neben den zu P WLT1 komplementaren Sequenzen. enthalt das Oligonukleotid neol in 5'-3' 
Richtung die Schnittstel.enfurdie Restriktionsendonukleasen Xbal. Smal, BamHI, Nhel und das 
Oligonukleotid neo2 (SEQ ID NO:58) in 5'-3* Richtung die Schnittstel.en fur die Restriktionsen- 
5 donukleasen AscI und Nhel. Die PCR Reaktion wurde nach Standardmethode wie Innis et al. 
rPCR Protocols. A Guide to Methods and Applications, Academic Press (1990)) mit PfuTurbo 
Polymerase (Stratagene. La Jolla, USA) durchgefOhrt Das erhaltene DMA Fragment mit einer 
Gr6ftevonungefahr1.3kb wurde mit dem GFX™PCR, DNA and Gel Band Purification Kit (A- 
m ersham Pharmacia. Freiburg) nach Angaben des Herstellers gereinlgt Das DNA-Fragment 
20 wurde mit den Restriktionsendonukleasen Xbal und AscI (New England Biolabs, Beverly, USA) 
g e S chni tt enundimAnsch,uada ra nemeutmitdemGFX-PCR.DNAandGe.BandPun^cafion 

Kit (Amersham Pharmacia. Freiburg) nach Angaben des Herstellers gereinigt Der Vektor 
DCUK1 wurde ebenfalls mit den Restriktionsendonukleasen Xbal und AscI geschnitten und m.t 
alkalischer Phosphatase (Roche Diagnostics. Mannheim) nach Angaben des Herstellers 
25 dephosphoryliert Nach Elektrophorese in einem 0.8%igen Agarosege. wurde der Hnearisierte 
Vektor (ca 2 1kb) mit dem GFX-PCR. DNA and Gel Band Purification Kit (Amersham Pharma- 
cia Freiburg') nach Angaben des Herstellers iso.iert Dieses Vektor-Fragment wurde mit Hilfe 
des Rapid DNA Ligation Kit (Roche Diagnostics. Mannheim) nach Angaben des Herstellers m.t 
dem geschnittenen PCR Fragment ligiert und der Ligationsansatz nach Standardmethoden wie 
-.0 in Sambrook et al. (Molecular Cloning. A Laboratory Manual. Cold Spring Harbor, beschne- 
benM 989)) in kompetente E.coli XL-1 Blue (Stratagene, La Jolla. USA) transformiert Eine Selek- 
«on auf Plasmid tragende Zel.en wurde durch das Ausp.attieren auf Ampicillin (50pg/ ml) und 
Kanamycin (20ug/ml) haltigen LB Agar (Lennox. 1955. Virology. 1:190) erreicht 

35 Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen. 
Hilden) nach Angaben des Herstellers isoliert und Ober Restriktionsverdaus Qberprutt. Das so 
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erhaltene Plasmid erhalt den Namen pCLiK2. 

Der Vektor pC LiK2 wurde mit der Restriktionsendonuklease Dral (New England Biolabs, Beverly, 
USA) geschnitten. Nach Elektrophorese in einem 0,8%igen Agarosegel wurde ein ca. 2,3 kb 
5 grofies Vektorfragment mit dem GFX™PCR, DNA and Gel Band Purification Kit (Amersham 
Pharmacia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor-Fragment wurde mit 
Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers 
religiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Molecular Clo- 
ning. A Laboratory Manual, Cold Spring Harbor, beschrieben (1989)), in kompetente E.coliXL- 
10 1Blue (Stratagene, La Jolla, USA) transformiert Eine Selektion auf Plasmid tragende Zellen 
wurde durch das Ausplattieren auf Kanamycin (20pg/ml) haltigen LB Agar (Lennox. 1955, Viro- 
logy, 1:190) eireicht 



Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
1 5 Hilden) nach Angaben des Herstellers isoliert und uber Restrikbonsverdaus Qberpriffi. Das so 
erhaltene Plasmid erhalt den Namen pC(JK3. 

Ausgehend vom Plasmid pWLQ2 (Liebl et al., 1 992) als Template fur eine PCR Reaktion wurde 
mit den Oligonukleotiden cg1 ((SEQ ID NO:59) und cg2 (SEQ ID NO:60) der Replikation- 
20 sursprung pHM1519 amplifizierL 

cg1 (SEQ ID NO:59): 

5'-GAGAGGGCGGCCGCGCAAAGTCCCGCTTCGTGAA-3' 



25 cg2 (SEQ ID NO:60): 

5-GAGAGGGCGGCCGCTCAAGTCGGTCAAGCCACGC-3' 

Neben den zu pWLQ2 komplementaren Sequenzen, enthalten die Oligonukleotide cg1 (SEQ ID 
NO:59) und cg2 (SEQ ID NO:60) Schnittstellen fQr die Restriktionsendonuklease Notl. Die PCR 

30 Reaktion wurde nach Standardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and 
Applications, Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) 
durchgefuhrt. Das erhaltene DNA Fragment mit einerGroBe von ungefahr2,7 kb wurde mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt Das DNA-Fragment wurde mit der Restriktionsendonuklease Notl 

35 (New England Biolabs, Beverly, USA) geschnitten und im AnschluB daran emeut mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
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dGS Herstellers garainigL Der VeKtcr pCL.K3 wurde ebenfalls mit der RestriWionsendonuWease 
N^a— nd mltalkallscber Phosphafcsa (Roc*e Diagnoses, Mannheim)) na*Anga- 

Spr n 9 Harbor. beschneben<19 8 9)). in kompe.en te E.OO. XL-1 Blue (Satfagan.. 

^ Imlen. Bne S^on au, Plasmld bagende Z e»en wurde duroh das Ausp*«beren au, 

Kane^mycin (20ug/ml) haltigen LB Agar (Lennox, 195 5.Wo l0g v, 1:190) erre,cnL 

Dle Plasmid-DNA ainas IndMduellen Klons wurde n* dem Qfeprep Spin M Wp«P « W 
nC nach Angaben das HersteLens MM und 0b ar Ras^onsvardaus Oberprut Das so 
erhaltene Plasmid erhaltden Namen P CLiK5. 

schen wailestgahend komplementaren Oligonuklaotida HS445 «SEQ ID w» > 
«EQ ID NO-62). dia Schnittstellen «r dia Restnkbonsendonukleasen Swa.. Xho.. M Apal. 
W18 1 Ndal, Spa.. EcoRV. M Clal, BamHI. Xba, und Sma, an.ha.tan, dun* g.rne,n- 
^el altn au, 95 -c und langsames abkohlen zu a^n, doppelsbanglgen DMA-Fragmen, 

vereinigt 

TCTAGACCCGGGATTTAAAT-3' 




35 



Oar Vek to r pCLIKS wurda m.. dan RasaiKUonsandonuWaasa Xho. und BamH. (New England 
« Bavady. USA) geschnlnen und m« alkalischer Phosphatase ,. (Roche D,agnosb^ 
nach Angaben das Harslallars dephosphc^lerL Nach Elekbephorese « e,nem 
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0,8%igen Agarosegel wurde der linearisierte Vektor (ca. 5,0 kb) mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia. Freiburg) nach Angaben des Herstellers iso- 
liert Dieses Vektor-Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, 
Mannheim) nach Angaben des Herstellers mit dem synthetischen Doppelstrangigen DNA- 
5 Fragment ligiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Mole- 
cular Cloning. A Laboratory Manual, Cold Spring Harbor. beschrieben(1989)), in kompetente 
E.coiiXL-1Blue (Stratagene. La Jolla, USA) transformierL Eine Selektion auf Plasmid tragende 
Zellen wurde durch das Ausplattieren auf Kanamycin (20ug/ml) haltigen LB Agar (Lennox. 1955, 
Virology, 1:190) erreicht 

10 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus OberprQfL Das so 
erhaltene Plasmid erhSIt den Namen pCLiKSMCS. 

1 5 Sequenzierungsreaktionen wurden nach Sanger et al. (1 977) Proceedings of the National Aca- 
demy of Sciences USA 74:5463-5467 durchgefOhrt Die Sequenzierreaktionen wurden mfttels 
ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet 

Das entstandene Plasmid pCLiK5MCS ist als SEQ ID NO: 65 aufgefOhrt. 

20 

Beispiel 2: Konstruktion von pCLiKSMCS integrativ sacB 

Ausgehend vom Plasmid pK19mob (Schaferetal., Gene 145,69-73(1994)) als Template fur eine 
PCR Reaktion wurde mit den Oligonukleotiden BK1732 und BK1733 das Bacillus subtilis sacB 
25 Gen (kodierend fOr Levan Sucrase) amplifiziert 

BK1732 (SEQ ID NO:63): 

5'-GAGAGCGGCCGCCGATCCTTTTTAACCCATCAC-3' 

30 BK1733 (SEQ ID NO:64): 

5'-AGGAGCGGCCGCCATCGGCATTTTCTTTTGCG-3' 



Neben den zu pEK19mobsac komplementaren Sequenzen, enthalten die Oligonukleotide 
BK1732 und BK1733 Schnittstellen fur die Restriktionsendonuklease Notl. Die PCR Reaktion 
35 wurde nach Standardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and Applica- 
tions, Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) durchge- 




# 
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{0hrt Das erhaltene DNA Fragmen. m* einer Gr 6 0e von unge«hr 1.3 Kb wurde m*, ta. 
GFX™PCR DNAand Ge, Band Purification K„<Amereham Pharmacia, Fre,burg> nach Angaben 
listers gereinigL Das DNA-Fragmen. wurde mK da, Restriktionaendonukuease NoU 
tTSS < B>o,abe Beverly, USA, geschnulen und » Anschfi* da ra n 
^FX™PCR. DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt 

Oar Vektor pCUKSMCS (herges,e», gema* Beispie, 1)wurda ebentalla ^""T^ 
dolwaL Nott gaschnittan and mi. alkallscher Phosphatase (. (Rocha Dagnosbcs. Manr. 

Aoaroseoel wurda ain ungalahr 2.4 kb grolles Vektorfragmant mrt dam 6FX™PCR. DMA and 
^ plcafion Kit (Amersham Pharmacy. Freiburg) nach Angaban das Hers.el.ers 
^ vlktor-Fregman, wurde rait Hitfe des Rapid DNA Ligation Kit (Rocha D^nosbc. 

r„nh^r* Angaben des Herstallers mi. dam gaschnittenen PGR Fragment kg** und <W 
^l^na* S^ndardmamodan wia k, Sambr~k a, aL (Molecular Ctanir^. A Laborato- 
Spring Harbor. beschr^en(1989)). k. kompetente EcaiXL-IBk* (Stratagene. 

^ren alf Kanamycin <20„g*n0 haifigan LB Agar (Lanno, 1055. Virology. 1:190, arretcht 
rv P>«mid DNA eines Individual^ Klons wurde mi. dam Qiaprap Spin Miniprep Kit (Qiagen. 
erhaltene PlaamkJ erhait den Neman pCLIKSMCS Megretiv aacB. 

Seguenzierungsreaktion rden nach Sanger a. a.. (1977, Preceadinga of me Na^na.Aca- 

demyTscianoea USA 74:5463-5467 durchge,6hrt Die Seguenzieneakfionen warden m,tte4s 
AB Tprism 377 (PE Applied Biosystems. Weitersted.) aufgetrenn. und ausgawarlat 

Das entstandene P-aamid pCLIKSMCS integra.lv sacB is. ala SEQ ID NO: 66 aulgetuhrL 

_p j „ am aiipn Fxnression oder OberprodukUon von metY-Genen 
Weitere Vektoren die zur erfindungsgemalien Expression 

geeig net sind, konnen in analoger Weise herstellt werden. 



Beispie. 3: isolierung des lysC Gens aus dem C. g.utamicum Stamm LU1479 

35 ,m ersten Schritt der Stammkonstruktion sol. ein a.lelischer Austausch des iysC ****** 
Kodilrend fDr das Enzym Asparfatkinase. in C. giutamicum ATCC13032. ,m foigenden LU1479 
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genannt, durchgefQhrt werden. Dabei soil im LysC Gen ein Nukleotidaustausch durchgefQhrt 
werden, so dass im resultierenden Protein die Aminosaure Thr an der Position 311 durch die 
Aminosaure lie ausgetauscht ist 

Ausgehend von der chromosomalen DNA aus LU1479 als Template fur eine PCR Reaktion 
wurde mit den Oligonukleotidprimem SEQ ID NO:67 und SEQ ID NO:68 lysC mit Hilfe des Pfu- 
Turbo PCR Systems (Stratagene USA) nach Angaben des Herstellers amplifizierL Chromo- 
somale DNA aus C. glutamicum ATCC 13032 wurde nach Tauch etal. (1995) Plasmid 33:168- 
1 79 oder Eikmanns et al. (1 994) Microbiology 140:1 81 7-1 828 prapariert Das amplifizierte Frag- 
ment wird an seinem 5'-Ende von einem Sail Restriktionsschnitt und an seinem 3'-Ende von 
einem Mlul Restriktionsschnitt flankiert Vor der Klonierung wurde das amplifizierte Fragment 
durch diese beiden Restriktionsenzyme verdaut und mit GFX™PCR, DNA and Gel Band Purifi- 
cation Kit (Amersham Pharmacia, Freiburg) aufgereinigt 

SEQ ID NO:67 

5'-GAGAGAGAGACGCGTCCCAGTGGCTGAGACGCATC— 3' 



SEQ ID NO:68 

5'-CTCTCTCTGTCGACGAATTCAATCTTACGGCCTG— 3' 

Das erhaltenen Polynukleotid wurde uber die Sail und Mlul Restriktionsschnitte in pCLIKS MCS 
integrate SacB (im folgenden pCIS genannt; SEQ ID NO: 66 aus Beispiel 2) kloniert und in 
E.coli XL-1 blue transformiert Eine Selektion auf Plasmid-tragende Zellen wurde durch das 
Ausplattieren auf Kanamycin (20ug/ml)-haltigen LB Agar (Lennox, 1955, Virology, 1:190) er- 
reicht Das Plasmid wurden isoliert und durch Sequenzierung die erwartete Nukleotidsequenz 
bestatigt Die Preparation der Plasmid-DNA wurde nach Methoden und mit Materialien der Firma 
Quiagen durchgefQhrt. Sequenzierungsreaktionen wurden nach Sanger etal. (1977) Procee- 
dings of the National Academy of Sciences USA 74:5463-5467 durchgefQhrt Die Sequenzier- 
reaktionen wurden mittels ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrenntund 
ausgewertet Das erhaltene Plasmid pCIS lysC ist als SEQ ID NO:69 aufgefGhrt Die entspre- 
chende Plasmidkarte ist in Figur 1 dargestellt 



Die Sequenz SEQ ID NO:69 umfasst die folgenden wesentlichen Teilbereiche: 
LOCUS pCISMysC 5860 bp DNA circular 
FEATURES Location/Qualifiers 
CDS ,} 155.. 1420 

/vntifkey= w 4" 
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flabel=lysC 
CDS complement 2> (3935..5356) 

/vntifkey="4" 

/label=sacB\(Baci»lus\subti»is) 
promoter complement(5357..5819) 

/vntifkey="30" 

/label=Promotor\sacB 
C_region complement(391 3..3934) 

/vntifkey="2" 

/label=sacB\downstreambereich 

CDS 1974..2765 

/vntlfkey="4" 

/label=Kan\R 
CDS complement(3032..3892) 

/vntifkey="4" 
/label=Ori\-EC\(pMB) 



1 > kodierende Sequenz 
2 > auf Komplementarstrang 

Beispicl 4: Mutagenese des lysC Gens aus C. glutamics 

Die gM Mutagenese des , y sC Oens aus ^« 

nukleotidprimer synthetisiert 



SEQ ID NO:70 wATTfirr ~. 

5 ,CGGCACCACCGACATCATCTTC A 0CTGCCCTCGTTCC6-3 



^ggITcgagggcaggtgaagatgatgtcggtggtgccg -3' 

korrespondierenden Enzym zu e,nem Am,nosa U resub 

SEQ ID NO-73). Oer resultierende Aminosaureaustausch Thr31 1lle im lysl, 

^ on in E.coli XU-b.ue und P^idprapa-ation durch a«^n— ».«—««• °- 
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Plasmid erhielt die Bezeichnung pCIS lysC thr31 1ile und ist als SEQ ID NO:74 aufgefuhrt. Die 
entsprechende Plasmidkarte ist in Figur 2 dargestellL 

Die Sequenz SEQ ID NO:74 umfasst die folgenden wesentlichen Teilbereiche: 

LOCUS pCISUysC\thr311ite 5860 bp DNA circular 
FEATURES Location/Qualifiers 
CDS 1) 155..1420 
/vntifkey="4" 
/label=[ysC 
CDS complement 2) (3935..5356) 
/vntifkey="4" 

/label=sacB\(Bacillus\subtilis) 
promoter complement(5357..581 9) 

/vntifkey^O" 

/label=Promotor\sacB 
C_region complement(391 3..3934) 

/vntjfkey= w 2 w 

/label=sacB\downstreambereich 
CDS 1974..2765 

/vntifkey= M 4" 

/label=Kan\R 
CDS complement(3032..3892) 

/vntifkey^" 

/label=OnVEC\(pMB) 

1) kodierende Sequenz 

2) auf Komplementarstrang 

Das Plasmid pCIS lysC thr31 1 ile wurde in C. glutamicum LU1479 mittels Elektroporation wie bei 
Liebl, et al. (1989) FEMS Microbiology Letters 53:299-303 beschrieben, transformiert Modifikati- 
onen des Protokolls sind in DE-A-1 0046870 beschrieben. Die chromosomale Anordnung des 
lysC-Lokus einzelner Transformanten wurde mit Standardmethoden durch Southembiot und 
Hybridisierung, wie in Sambrook et al. (1989), Molecular Cloning. A Laboratory Manual, Cold 
Spring Harbor, beschrieben, uberpruft. Dadurch wurde sichergestellt, dass es sich bei den 
Transformanten urn solche handelt, die das transformierte Plasmid durch homologe Rekombina- 
tion am lysC-Lokus integriert haben. Nach Wachstum solcher Kolonien Ober Nacht in Medien, 
die kein Antibiotikum enthielten, wurden die Zellen auf ein Saccharose-CM-Agarmedium (10% 
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Saccharose) ausplatUart und bei 30"C for 24 Stunden inkubiert. 

Da das im Vektor pCIS lysC taSHh entbaitende sacB Gan Saccharose in ein toxisches Pro- 
l W :Znde,. 1« nu r soiche Koionien anwachse, d* das sacB <^ "~ ~ 
ten homo-ogen Rekombinattonsschm. zwischen dem Wiidtyp .ysC Gen und "OertenGen 
5 lcmr31llde1etie rt haben.Wah re ndde^^^^ 

£ Gen Oder das mparts Gen zusammen mit dem sacB Gen deleter, werden. Wenn 

Gen zusammen mi. dam Wildtyp Gen entfem. wind, resultier. alna muoerte Transformante. 

Anwachsende Koionien wurden gepickt und auf eine Kanamycin-sensiSven Phano*. bin unter- 
10 sucht Kione mitde^ertem SacB Gen mOssen oieicbzeito Kanamydn-sensthves Wachshtms- 
vamaitan zeigen. Scicbe Kan-sensHiven Kione wurde im einem Scbudeikoiben aut ,hre Lysm- 
^* untersuch,(s,ehe Beispie.e.ZumVergieicbwurdedern^ebandeteS^m 

^angezc^Ktonemae^^ 

selektiert chromosomale DNA wurde gewonnen und der entsprechende Beraich des ryaC Gens 
, 5 : Z dumb eine PCR-Reak«on ampler, und seguenzied. Bin ~ Bgen- 

achat, erhdhter Lysin-Synthese und nachgewiesener Mutation « .ysC an der Stone 932 wurde 
mitLU1479lysC311«e bezeichnet). 

Beispial 5: Herstellung Ethionin-resistenter C. glutamicum Stamme 

™) behandeK. urn eine Ed.ionin-Resis.enz (Kase. H. Nakayama KAgr. B,o>. Chem. 39 ,53- 
^1975 L-methkmine Portion by methionine ™*^^ 

g ,utamicum, zu induzieren: Eine Obemachtkuaur in BH.-Medium (D*co, wurde .n Gauffer 
' DH 5 5) gevraS chen und bei 30-C for 20 min mi. N^myt-nBrosoguamdm (10mg/ml m 
2 ol cC PH .5, behandett. Nach der Bebandiung mUdem cnemiscnen Mutagen N-Mettiyl- 
roguanidin wurden die Zeiien gewascben (GUratpuner 50mM pH 5.5) und auf em^drum 
piadier. das aus .oigenden Komponenten, berechne. aut 500ml. zusammengesetd ^ 10g 
Z^O. 0.5g KH,PO 4 .0.5g K,HPO..0.125, MgSO,7H,0. 21g MOPS. SOmg CaO, 5mg 
30 LtLatechuat, 0.5mg Biotin. tmgThiamin. 5gA D.L-E.hionin (Sigma Cbam,C3 te Deu^niand), 
pH 7 0 Auiierdem enmiett das Medium 0.5m. einer SpurensalztSsung aus: tOgfl FOO^W. 
^MnSO/H^.O.tg/iZnSO^ 

utMHC.ge^Dastertigzusammenges.eilteMediumwurdastan.nknertundnacbZugabavon 
40m. starter 50% Glucoseidsung. mi. nossigem stenlem Agar in einer Endkonzentrat.cn von 
35 1 ,5% Agar versetzt und in Kulturschalen ausgegossen. 
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Auf Platten mit dem beschriebenen Medium wurden mutagenisierte Zellen aufgebracht und 3-7 
Tage bei 30°C inkubiert Erhaltene Klone wurden isoliert, mindestens einmal auf dem Selekti- 
onsmedium vereinzelt und dann auf ihre Methionin-Produktivitatin einem SchQttelkolben in Me- 
dium II untersucht (siehe Beispiel 6 

5 

Beispiel 6: Herstellung von Methionin mit dem Stamm LU1479 lysC 311ile ET-16. 

Die in Beispiel 5 hergestellten Stamme wurden auf einer Agar-Platte mit CM-Medium fur 2 Tag 
bei 30°C angezogen. 

10 CM-Agan 

1 0.0 g/l D-Glucose, 2,5 g/l NaCI, 2,0 g/I Hamstoff . 1 0,0 g/l Bacto Pepton (Difco), 5,0 
g/l Yeast Extract (Difco), 5,0 g/l Beef Extract (Difco), 22,0 g/l Agar (Difco), autoklaviert (20 min., 
121°C) 

1 5 AnschlieSend wurden die Zellen von der Platte abgekratzt und in Saline resuspendiert FOr die 
Hauptkultur wurden 10 ml Medium II und 0,5 g autoklaviertes CaC0 3 (Riedel de Haen) in einem 
1 00 ml Erienmeyerkolben mit der Zellsuspension bis zu einer OD600nm von 1 .5 beimpft und fur 
72h auf einem OrbitalschutHer mit 200 Upm bei 30°C inkubiert 



20 


Medium II: 






40g/l 


Saccharose 




60g/l 


Melasse (auf 100% Zuckergehalt berechnet) 




10g/l 


(NH4>2S0 4 




0.4g/l 


MgS0 4 *7H20 


25 


0.6g/l 


KH2PO4 




0.3mg/l 


Thiamin*HCI 




1mg/i 


Biotin (aus einer 1 mg/ml steril filtrierten StammlSsung die mit NH 4 OH auf pH 
8,0 eingestellt wurde) 




2mg/l 


FeS0 4 


30 


2mg/l 


MnS0 4 



mit NH4OH auf pH 7,8 eingestellt, autoklaviert (121 °C, 20 min). Zusatzlich wird Vitamin B12 
(Hydroxycobalamin Sigma Chemicals) aus einer Stammlosung (200 yg/ml, steril filtriert) bis zu 
einer Endkonzentration von 100 pg/l zugegeben 

35 Gebildetes Methionin, sowie andere Arninosauren in der Kulturbruhe wurde mit Hilfe der Ami- 
nosauresaure-Bestimmungsmethode von Agilent auf einer Agilent 1100 Series LC System 
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^d^ 

Hypersil AA-Saule (Agilent) statt. 

5 Solcbe Klone warden isoKert. de-en Memio^roduktiviUSt mirKte^ns doppett so boch war. wte 
eingesetzt und bekam die Bezelchnung LU1479 lysC 31 1«e ET-16. 

Be.sp.e. 7: Kteniemng von me.Y aus Mycobacterium lube— und Ktemenjng in das Has- 
1 0 mid pC Phsdh metY_Mt 

Chromoaomaie DMA von Mycobacterium teaercu/oste wurde von der American Type Strain 
f Trr^ATCC A«anta-USA) aus dem Stamm ATCC 25584 bezogen. Chromosomate 

Eikmanns et al. (1994) Microbiology 140:1817-1828 prapariert 

u, . _i„ri m »r <!EO ID NO-75 und S6Q ID NO:76, der chromosomalen DNA aus 

Po^merase-Kettenrealdion (PCR, nacn Standardmethoden wte Innis et al. (1990) PGR 
LTa Guide to Memoes and Applicauons. Academic Press eln DNA Fragment von ca.180 
t InpLen aus dem nicbfcodierenden S-Bereich (Promoterregion) der Homosenndenydn> 
Lnasnr^amplitaertDasampr^erteFragmentistanseir^ 

C^ssTh^ und am 3-Ende von einem Ober das Cigo eingefObrten zu metV aus 
Mycobacterium tuberculosis homologen Bereich flankiert 

SEQ ID NO:75 

5--GAGAGGATCCGGAAGGTGAATCGAATTTCGG -3' 
und 

SEQIDNO:76 

5*-CTATTGCTGTCGGCGCTCATGATTCTCCAAAAATAATCGC —3 

Das erhaitene DNA Fragment wurde mitdem GFX™PCR. DNA and Ge, Band Purification Kit 
(Amersham Pharmacia, Freiburg) nach Angaben des Herstel.ers gereinigt 

Ausgehend von der chromosomalen ™A aus Mycofcatfe^^ 

POR Reaktton wurde mit den Oligonukleotidprimem SEQ ID NO:77 und SEQ ID NO:78 metY mrt 
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25 



30 



35 
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Hilfe des GC-RICH PCR Systems (Roche Diagnostics, Mannheim) nach Angaben des 
Herstellers amplifizierl Das amplifizierte Fragment ist an seinem 3'-Ende von einer Xbal- 
Restriktionsschnittstelle, die uber das Oligo eingefQhrt wurde, flankiert. 

SEQ ID NO:77 

5'-ATGAGCGCCGACAGCAATAG -3' 
und 

SEQ ID NO:78 

5'-GAACTCTAGATCAGAACGCCGCCACGGAC -3* 

Das ca. 1 .4 kb groBe erhaltene DNA Fragment wurde mit dem GFX™PCR, DNA and Gel Band 
Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt 

In einer weiteren PCR Reaktion wurden die beiden oben erhaltenen Fragmente gemeinsam als 
1 5 Template eingesetzL Durch die mit dem Oligonukleotidprimer SEQ ID NO:76 eingebrachte. zu 
dem metY Fragment homologen Bereichen, kommt es im Zuge der PCR-Reaktion zu einer 
Anlagerung beider Fragmente aneinander und einer Verlangerung zu einem durchgehenden 
DNA-Strang durch die eingesetzte Polymerase. Die Standardmethode wurde dahingehend modi- 
fiziert, dass die verwendeten Oligonukleotidprimer SEQ ID NO:75 und SEQ ID NO:78 erst mit 
20 Beginn des 2. Zykluses dem Reaktionsansatz zugegeben wurden. 

Das amplifizierte DNA Fragment von ungefahr 1 ,6 kb wurde mit dem GFX™PCR, DNA and Gel 
Band Purification Kit nach Angaben des Herstellers gereinigt Im AnschluB daran wurde es mit 
den Restriktionsenzymen BamHI und Xbal (Roche Diagnostics, Mannheim) gespalten und ge- 
25 lelektrophoretisch aufgetrennt AnschlieBend wurde das ca. 1,6 kb groBe DNA Fragment mit 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia. Freiburg) aus der Aga- 
rose aufgereinigt. 



Der VektorpClikSMCS SEQ ID NO:65, im folgenden pCgenannt, wurde mit den Restriktionsen- 
zymen BamHI und Xbal (Roche Diagnostics. Mannheim) geschnitten und ein 5 kb groBes Frag- 
ment nach elektrophoretischer Auftrennung mit GFX™PCR, DNA and Gel Band Purification Kit 
isoliert - 



35 



Das Vektorfragment wurde zusammen mit dem geschnittenen und aufgereinigten PCR- 
Fragment mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics. Mannheim) nach Angaben 
des Herstellers ligiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. 
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(Molecu.ar Cloning. A Laboratory Manual. Cold Spring Harbor. beschrieben(1989)). in kompe- 
tente E co«i XL-1B«ue (Stratagene. La Jo.la. USA) transferrin Eine Selektion auf Plasm,d 
tragende Zellen wurde durch das Ausplattieren auf Kanamycin (20ugAnl) haltigen LB Agar 
(Lennox. 1955. Virology. 1:190) erreicht. 

Die Preparation der Plasmid DNA wurde nach Methoden und mit Materialien der Fa. Quiagen 
durchgefQhrt.Sequenzierungsr e aktionenwurdennach Sanger etal. (1977) Proceedings of the 
National Academy of Sciences USA 74:5463-5467 durchgefOhrt Die Sequenzierreaktionen wur- 
den mittels AB. Prism 377 (PE Applied Biosystems. Weiterstadt) aufgetrennt und ausgewertet 

Das entstandene Plasmid pC Phsdh metY.Mt (Mycobacterium tuberculosis) ist als SEQ ID 
NO:79 aufgefuhrt Die entsprechende Plasmidkarte ist in Figur 3 dargestellt 

Die Sequenz SEQ ID NO:79 umfasst die folgenden wesentlichen Teilbereiche: 

LOCUS pC\Phsdh\metY_Mt 6591 bp DNA circular 21-JUL-2003 

FEATURES Location/Qualifiers 
CDS 156..1505 
/vntifkey="4" 

/label=metY\aus\M\tuberculosis 
CDS 1855..2646 

/vntifkey="4" 

/iabel=Kan\R 
CDS 4927..6048 

/vntifkey="4" 

/label=Rep\Protein 
CDS 391 9.-4593 

/vntifkey="4" 

/label=ORR1 
CDS complement(2913..3773) 

/vntifkey="4" 

/label=Ori\-EC\(pMB) 



Beispiel 8:Transformation des Stammes LU1479 lysC 31 1ile ET-16 mit dem Plasmid pC Phsdh 
metY_Mt 

Der Stamm LU1479 lysC 311ile ET-16 wurde mit dem Plasmid pC Phsdh metY_Mt nach der 
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beschriebenen Methode (Liebl, etal. (1989) FEMS Microbiology Letters 53:299-303) transform- 
iert Die Transformationsmischung wurde auf CM-Platten plattiert die zusatzlich 20mg/l Kana- 
mycin enthielten, urn eine Selektion auf Plasmid-haltige Zellen zu erreichen. Erhaltene Kan- 
resistente KJone wurden gepickt und vereinzelt Die Methionin-Produktivitat der Klone wurde in 
einem SchGttelkolbenversuch (s. Beispiel 6) untersucht. DerStamm LU1479 lysC 31 1ile ET-16 
pC Phsdh metY_Mt produzierte im Vergleich zu LU1479 lysC 31 1 ile ET-16 signifikant mehr Me- 



thionin. 
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2. 



Verfahren zur fermentativen HersteUung wenigstens einer schwefelha.tigen 
Feinchemikalie. welches folgende Schritte umfasst 



a) 



b) 



ikaiie, weicne& i«'a=»- . 

Fermentation einer die gewOnschte schwefelhalbge Fe,ncnen*al,e 
produzierenden coryneformen Baktenenkuitur. wobei in den coryneformen 
Bakterien zumindest eine heterologe Nukleotidsequenz 
welchefQrein Protein m no-AceryWHomo8erirvSu«hydrolase (metYj^ktwrtat 

^hening der schwefelhaWgen Feinchemikalie im Medium Oder in den 

Zellen der Bakterien, und 
c) isolieren der schwefelhaltigen Feinchemikalie. 

Verfahren nach Anspruch 1. wobei die schwefe.ha.tige Feinchemikalie L-Methionin 
umfasst 

Verfahren nach einem der vorhe^ehenden Anspmche. wobei die heteroioge me.Y- 
Z^L Nukleoadsequenz zur melY-kodierenden Sequenz „ C 
g,utamicum ATCC 13032 eine Sequenzhomoiogie vom wemger ais 100 ^ aufwe«t 

Verfahmn nach Anspruch 3. wobei die metY-kodierende Sequenz aus einem der 
folgenden Organismen abgeleitet ist 



Corvnebac ^rium diphteriae 

z Z _i ZmZZT *m fi ihorri i Iritis 



ATCC 14779 



Mycobacterium tuberculosis 
CDC1551 



Clostridium acetobutylicum 



Bacillus halodurans 

Bacillus ste nrothermophilus 



Chlorobium tepidum 



Synechococcus sp. 



Emericella nidulans 



Bacteroides fragilis 



Lactococcus lactis 



ATCC 25584 



ATCC 824 



ATCC21591 



ATCC 12980 



ATCC 49652 



ATCC27104 



ATCC 36104 



ATCC 25285 



ATCC 7962 



Bordetella bronchiseptica 



Pseudomonas aeruginosa 



Nitrosomonas europaea 



Sinorhizobium meliloti 



Thermotoga maritima 



Streptococcus mutans 



Burkholderia cepacia 




ATCC 19395 



ATCC 17933 



ATCC 19718 



ATCC 4399 



ATCC 43589 



ATCC 25175 



ATCC 25416 
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Rhodobacter capsulatus 


ATCC 11166 


Pasteurella multocida 


ATCC 6530 


oiosinoiurn omiciie 


A ICC 9oo9 


Campylobacter jejuni 


ATCC 33560 


Streptococcus pneumoniae 


ATCC 6308 


Saccharomyces cerevisiae 


ATCC 2704 


Kluyveromyces lactis 


ATCC 8585 


Candida albicans 


ATCC 10231 


Schizosaccharomyces pombe 


ATCC 24969 



5. Verfahren nach einem der vorhergehenden Anspruche, wobei die metY-kodierende 
Sequenzeine kodierende Sequenz gemali SEQ ID NO:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 
21, 23, 25, 27, 29, 31, 33, 35. 37, 39, 41, 43, 45, 47, 49, 51 und 53 oder eine dazu 
homologe Nukleotidsequenz, welche fur ein Protein mit metY-Aktivitat kodiert, umfasst 

6. Verfahren nach einem der vorhergehenden Anspruche, wobei die metY-kodierende 
Sequenz fflr ein Protein mit metY-Aktivitat kodiert, wobei das Protein eine 
Aminosauresequenz gemaS SEQ ID NO:2, 4, 6, 8, 10, 12, 14 f 16, 18, 20, 22, 24, 26, 28, 
30, 32. 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 Oder eine dazu homologe 
Aminosauresequenz, welche fOr ein Protein mit metY-Aktivitat steht, umfasst 

7. Verfahren nach einem der vorhergehenden Anspruche, wobei die kodierende metY- 
Sequenz eine in coryneformen Bakterien replizierbare oder eine stabil in das 
Chromosom intregrierte DNA oder eine RNA ist 

8. Verfahren gemali Anspruch 7, wobei man 

a) einen mit einem Plasmidvektor transformierten Bakterienstamm einsetzt der 
wenigstens eine Kopie der kodierenden metY-Sequenz unter der Kontrolle 
regulativer Sequenzen tragt, oder 

b) einen Stamm einsetzt, in dem die kodierende metY-Sequenz in das Chromosom 
des Bakteriums integriert wurde 

9. Verfahren nach einem der vorhergehenden Anspruche. wobei die kodierende metY- 
Sequenz Oberexprimiert wird. 

10. Verfahren gemaft einem der vorhergehenden Anspruche, wobei man Bakterien 
fermentiert. in denen zusatzlich wenigstens ein weiteres Gen des Biosyntheseweges der 




11. 



12. 
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newanschten schwefe.haltigen Feinchemika.ie verstanclistoderderartmutiertist, dass 
es durch Stoffwechselmetabo.ite nicht in seiner Aktivitat beeinflusstwird. 

Verfahren gema* einem der vorhergehenden AnsprOche. wobei man Bakterien 
ferrnentiert.indenenv^nigstenseinStoffwechse^ 

ist . der die Bildung der gewGnschten schwefelhaltigen FeinchemikaHe vemngert 

Verfahren gema* einem der vorhergehenden AnsprOche, wobei man coryneforme 
Bakterien fermentiert in denengieichzeitigwenigstense^^ 

a) dem fur eine Aspartatkinase kodierenden Gen lysC, 

b) cemfQrdieGlycerinaldehyd-3-PhosphatDehydrogenasekodierendenGengap. 

c) dem fQr die 3-Phosphoglycerat Kinase kodierenden Gen pgk, 

d) dem fdr die Pyruvat Carboxylase kodierenden Gen pyc, 

e) dem fOr die Triosephosphat Isomerase kodierenden Gen tpi, 
n dem fur die Homoserin O-Acetyltransferase kodierenden Gen metA, 

g) dem fOr die Cystahionin-gamma-Synthase kodierenden Gen metB, 

h) dem fQr die Cystahionin-gamma-Lyase kodierenden Gen metC. 
D dem fQr die Serin-Hydroxymethyltransferase kodierenden Gen glyA. 
D dem fur die Methy.en-Tetrahydrofo.at-Reduktase kodierenden Gen metF. 
Jo dem fQr die Vitamin B12 abhangige Methionin-Synthase kodierenden Gen metH. 
,) dem fdr die Phosphoserin-Aminotransferase kodierenden Gen serC 
m ) dem fOr die Phosphoserin-Phosphatase kodierenden Gen serB 
n) dem fOr die Serine Acetyl-Transferase kodierenden Gen cysE. und 
o) dem fQr eine Homoserin-Dehydrogenase kodierenden Gen horn. 

Oberexprimiert oder so muflert ist, dass die korrespondierenden Proteine vergiichen mtt 
nicht mutierten Proteinen. in geringerem Made oder nicht durch StoffwechseimetaboUte 
in ihrer Aktivitat beeinflusst werden. 

Verfahren gemaa einem der vorhergehenden AnsprOche. wobei man coryneformen 
Baktene n fen.entiert,indeneng.eichzeitigwenigstenseinesderGene.a 

a) dem fQr die Homoserine-Kinase kodierenden Gen thrB, 

b) dem fQr die Threonin Dehydratase kodierenden Gen HvA, 

c) dem fQr die Threonin Synthase kodierenden Gen thrC 

d) dem fur die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 



13. 
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e) 

f) 

g) 

h) 

i) 

J) 



dem fur die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck, 

dem fur die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pgi, 

dem fur die Pyruvat-Oxidase kodierenden Gen poxB, 

dem fur die Dihydrodipicolinat Synthase kodiemden Gen dapA, 

dem fur die Dihydrodipicolinat Reduktase kodiemden Gen dapB; oder 

dem fur die Diaminopicolinat Decarboxylase kodiemden Gen 



10 

14. 



15. 

15 



20 



16. 

25 



durch Veranderung der Expressionsrate oder durch Einfuhrung einergezielten Mutation 
abschwacht ist 

Verfahren gemaB einem oder mehreren der vorhergehenden AnsprQche, wobei man 
Mikroorganismen der Art Corynebacterium glutamicum einsetzt 

Verfahren zur Herstellung eines L-Methionin haltigen Tierfuttermittel-Additivs aus 
Fermentationsbruhen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden 
Mikroorganismus in einem Fermentationsmedium; 

b) Entfemung von Wasser aus der L-Methionin haltigen FermentationsbrOhe; 

c) Entfemung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
von 0 bis 100 Gew.-%; und 

d) Trocknung der gemaB b) und/oder c) ertialtenen Fermentafionsbruhe, um das 
Tierfuttermittel-Additiv in der gewunschten Pulver- oder Granulatform zu ertialten. 

Verfahren gemaB Anspruch 15, wobei man Mikroorganismen gemaB der Definition in 
einem der Ansprfiche 1 bis 14 einsetzL 



% v 
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Fig.l 
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Fig. 2 
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Fig. 3 
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SEQUENZPROTOKOLL 



<110> BASF AG 



<120> Verfahren zur Herstellung schwef elhaltiger Feinchemikalien 



<130> M/43128 

<160> 66 

f --> <170> Patentln version 3.1 

<210> 1 

<211> 1317 

<212> DNA 

<213> Corynebacterium diphtheriae 



<220> 

<221> CDS 

<222> (1)..(1317) 

<223> 



<400> 1 

atg cca aca aaa tac gat aat tec aat gec aac aaa tgg ggt ttc gag 4 8 

Met Pro Thr Lys Tyr Asp Asn Ser Asn Ala Asn Lys Trp Gly Phe Glu 
1 5 10 15 

act cgc tec ate cac gca gga caa age gtc gat agt gat acc agt gee 96 
Thr Arg Ser lie His Ala Gly Gin Ser Val Asp Ser Asp Thr Ser Ala 
20 25 30 

cgc aac eta ccg att tac ctg aca tea teg tac gtt ttt aat gac gee 144 
Arg Asn Leu Pro lie Tyr Leu Thr Ser Ser Tyr Val Phe Asn Asp Ala 
35 40 45 

gaa cac gca gca aac cgc ttc aac ctt tec gac gee ggc ccg gtt tac 192 
Glu His Ala Ala Asn Arg Phe Asn Leu Ser Asp Ala Gly Pro Val Tyr 
50 55 60 

tct cgc ctg acc aac cca act gtc gcg gca gtc gaa gaa cgc eta gee 240 
Ser Arg Leu Thr Asn Pro Thr Val Ala Ala Val Glu Glu Arg Leu Ala 
65 70 75 80 
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aat ctt gaa ggt ggc gta cac gcc gta ctt ttc get tec gga atg gec 288 
Asn Leu Glu Gly Gly Val His Ala Val Leu Phe Ala Ser Gly Met Ala 
85 90 95 

gcc gaa acc gcc gca ate etc aac ate gcc cgc gcg ggt tec cac ate 
Ala Glu Thr Ala Ala He Leu Asn He Ala Arg Ala Gly Ser His He 
100 105 110 

gtg tec agt cct cgc att tac ggc ggc acc gaa aca etc ttt gcc gtc 
Val Ser Ser Pro Arg He Tyr Gly Gly Thr Glu Thr Leu Phe Ala Val 
115 120 125 

aca ttg gca cgc ctg ggc ate gaa acc act ttc gta gaa aat cct gac 
Thr Leu Ala Arg Leu Gly He Glu Thr Thr Phe Val Glu Asn Pro Asp 
130 135 140 

gac cca gcc tea tgg gag get gca gtt caa gac aac acg gta get etc 
Asp Pro Ala Ser Trp Glu Ala Ala Val Gin Asp Asn Thr Val Ala Leu 

145 "0 155 160 @ 

tac gga gaa acc ttc get aat cca caa gca gac gtg ctt gat att ccc 528 
Tvrr Gly Glu Thr Phe Ala Asn Pro Gin Ala Asp Val Leu Asp He Pro 
165 170 175 



336 



384 



432 



480 



gca a tc gca gag gtt gcc cat aaa cat caa gta cca ctg ate gtc gac 
Ala He Ala Glu Val Ala His Lys His Gin Val Pro Leu He Val Asp 
180 185 190 

aac acc etc gca acc gca gcc ctt gta cgc ccc etc gaa etc ggt gca 
Asn Thr Leu Ala Thr Ala Ala Leu Val Arg Pro Leu Glu Leu Gly Ala 
195 200 205 

gac gtc gtc gtg gca tec eta acc aag ttc tac acc gga aat ggc tec 
Asp Val Val Val Ala Ser Leu Thr Lys Phe Tyr Thr Gly Asn Gly Ser 
210 215 220 

gga etc ggc gga gtg ctt atc gac ggc gga aac ttc gac tgg acc gtc 
Gly Leu Gly Gly Val Leu He Asp Gly Gly Asn Phe Asp Trp Thr Val 
22 | 230 235 240 

aca cgc aac ggc g aa ccg atc ttc ccc gac ttt gtc acc cca gat ccc 
Thr Arg Asn Gly Glu Pro He Phe Pro Asp Phe Val Thr Pro Asp Pro 
245 250 255 

gcc tat cac ggt etc aag tat tec gat ctt ggt gcc ccc gcc ttc gga 
Ala Tyr His Gly Leu Lys Tyr Ser Asp Leu Gly Ala Pro Ala Phe Gly 
260 265 270 

eta aag get cgc gtc gga etc ctg cgc gac acc ggc gca gcc cca tea 
Leu Lys Ala Arg Val Gly Leu Leu Arg Asp Thr Gly Ala Ala Pro Ser 
275 280 285 

cca etc aac gca tgg atc acc gca caa ggg etc gac acc etc teg eta 
Pro Leu Asn Ala Trp He Thr Ala Gin Gly Leu Asp Thr Leu Ser Leu 
290 295 300 

cga gta caa cgc cac aac gaa aac gca etc gca gta gca caa ttc etc 
Arq Val Gin Arg His Asn Glu Asn Ala Leu Ala Val Ala Gin Phe Leu 
305 310 315 320 

gcc aac cac gag aaa gta gcc aag gtt aac tac gca ggc ctt ccc gac 
Ala Asn His Glu Lys Val Ala Lys Val Asn Tyr Ala Gly Leu Pro Asp 



576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 
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325 



330 335 



tec cct tgg tac cca gtc aaa gaa aaa etc gga ttc gac tac acc ggc 
Ser Pro Trp Tyr Pro Val Lys Glu Lys Leu Gly Phe Asp Tyr Thr Gly 
340 345 350 

tec gta ctt tec ttt gac gtt aaa ggt gga aaa aac gaa gca tgg cgc 
Ser Val Leu Ser Phe Asp Val Lys Gly Gly Lys Asn Glu Ala Trp Arg 
355 360 365 

ttt atc gac gca c tc aaa eta cac teg aac etc gee aac gtc gga gac 
Phe He Asp Ala Leu Lys Leu His Ser Asn Leu Ala Asn Val Gly Asp 
370 * 375 360 

ata cgt tec ctc gta gtc cac cca gcg acc acc acg cac tea caa teg 
Val Arg Ser Leu Val Val His Pro Ala Thr Thr Thr His Ser Gin Ser 
385 390 395 400 

gaa gaa teg gca ctt eta gee gca gga att aat caa gca acc ate cga 
Glu Glu Ser Ala Leu Leu Ala Ala Gly He Asn Gin Ala Thr He Arg 
405 410 415 

etc tec gtc ggc atc gaa tec atc gac gac atc atc gec gac ctc aca 
Leu Ser Val Gly He Glu Ser He Asp Asp He He Ala Asp Leu Thr 
420 425 430 

gca ggt ttc gac gca atc taa 
Ala Gly Phe Asp Ala He 
435 



<210> 2 

<211> 438 

<212> PRT 

<213> Corynebacterium diphtheriae 

<400> 2 

Met Pro Thr Lys Tyr Asp Asn Ser Asn Ala Asn Lys Trp Gly Phe Glu 
! 5 10 15 

Thr Arg Ser He His Ala Gly Gin Ser Val Asp Ser Asp Thr Ser Ala 
20 25 30 

Arg Asn Leu Pro He Tyr Leu Thr Ser Ser Tyr Val Phe Asn Asp Ala 
35 40 45 

Glu His Ala Ala Asn Arg Phe Asn Leu Ser Asp Ala Gly Pro Val Tyr 
50 55 60 

ser Arg Leu Thr Asn Pro Thr Val Ala Ala Val Glu Glu Arg Leu Ala 
65 70 75 80 



1056 



1104 



1152 



1200 



1248 



1296 



1317 
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Asn Leu Glu Gly Gly Val His Ala Val Leu Phe Ala Ser Gly Met Ala 
65 90 95 

Ala Glu Thr Ala Ala lie Leu Asn He Ala Arg Ala Gly Ser His He 
100 105 110 

Val Ser Ser Pro Arg He Tyr Gly Gly Thr Glu Thr Leu Phe Ala Val 
X15 120 125 

Thr Leu Ala Arg Leu Gly He Glu Thr Thr Phe Val Glu Asn Pro Asp 
130 135 140 

Asp Pro Ala Ser Trp Glu Ala Ala Val Gin Asp Asn Thr Val Ala Leu 
145 150 155 160 

Tyr Gly Glu Thr Phe Ala Asn Pro Gin Ala Asp Val Leu Asp He Pro 
165 170 175 

Ala He Ala Glu Val Ala His Lys His Gin Val Pro Leu He Val Asp 
180 185 190 

Asn Thr Leu Ala Thr Ala Ala Leu Val Arg Pro Leu Glu Leu Gly Ala 
195 200 205 

Asp Val Val Val Ala Ser Leu Thr Lys Phe Tyr Thr Gly Asn Gly Ser 
210 215 220 

Gly Leu Gly Gly Val Leu He Asp Gly Gly Asn Phe Asp Trp Thr Val 
225 230 235 240 

Thr Arg Asn Gly Glu Pro He Phe Pro Asp Phe Val Thr Pro Asp Pro 
245 250 255 

Ala Tyr His Gly Leu Lys Tyr Ser Asp Leu Gly Ala Pro Ala Phe Gly 
260 265 270 

Leu Lys Ala Arg Val Gly Leu Leu Arg Asp Thr Gly Ala Ala Pro Ser 
275 280 285 

Pro Leu Asn Ala Trp lie Thr Ala Gin Gly Leu Asp Thr Leu Ser Leu 
290 295 300 

Arg Val Gin Arg His Asn Glu Asn Ala Leu Ala Val Ala Gin Phe Leu 
305 310 315 320 



Ala Asn His Glu Lys Val Ala Lys Val Asn Tyr Ala Gly Leu Pro Asp 
325 330 335 
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Ser Pro Trp Tyr Pro Val Lys Glu Lys Leu Gly Phe Asp Tyr Thr Gly 

340 345 350 

Ser Val Leu Ser Phe Asp Val Lys Gly Gly Lys Asn Glu Ala Trp Arg 
355 360 365 

Phe He Asp Ala Leu Lys Leu His Ser Asn Leu Ala Asn Val Gly Asp 
370 375 380 



Val Arg Ser Leu Val Val His Pro Ala Thr Thr Thr His Ser Gin Ser 
385 ~ 390 395 400 

Glu Glu Ser Ala Leu Leu Ala Ala Gly He Asn Gin Ala Thr He Arg 
405 410 415 



Leu Ser Val Gly He Glu Ser He Asp Asp He He Ala Asp Leu Thr 
420 425 430 



Ala Gly Phe Asp Ala He 
435 



<210> 3 

<211> 1350 

<212> DNA 

<213> Mycobacterium tuberculosis 
<220> 

<221> CDS 

<222> (1)..(1350) 

<223> 



<400> 3 

atg age gec gac age aat age acc gac gec gat ccg acc gcg cat tgg 48 

Met Ser Ala Asp Ser Asn Ser Thr Asp Ala Asp Pro Thr Ala His Trp 

! 5 10 15 



teg ttc gaa acc aaa cag ata cac get ggt cag cac cct gat ccg acc 
Ser Phe Glu Thr Lys Gin He His Ala Gly Gin His Pro Asp Pro Thr 
20 25 30 



96 



acc aac gec egg get ctg ccg ate tat gcg acc acg teg tac acc ttc 
Thr Asn Ala Arg Ala Leu Pro He Tyr Ala Thr Thr Ser Tyr Thr Phe 
35 40 45 
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gac gac acc gcg cac gcc gcc gcc ctg 
Asp Asp Thr Ala His Ala Ala Ala Leu 
50 55 

aat ate tac acc egg ate ggc aac ccc 
Asn lie Tyr Thr Arg lie Gly Asn Pro 
65 70 
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ttc gga ctg gaa att ccg ggc 192 
Phe Gly Leu Glu lie Pro Gly 
60 

acc acc gac gtc gtc gag cag 240 
Thr Thr Asp Val Val Glu Gin 
75 80 



cgc ate gcc gcg etc gag ggc ggt gtg gcc gcg ctg ttc ctg teg teg 288 
Arg He Ala Ala Leu Glu Gly Gly Val Ala Ala Leu Phe Leu Ser Ser 
85 90 95 

ggg cag gcc gcg gag acg ttc gcc ate ttg aac ctg gcc ggc gcg ggc 336 
Gly Gin Ala Ala Glu Thr Phe Ala He Leu Asn Leu Ala Gly Ala Gly 
100 105 110 

gat cac ate gtg tec age ccg cgc ctg tac ggc ggc acc tac aac ctg 384 
Asp His He Val Ser Ser Pro Arg Leu Tyr Gly Gly Thr Tyr Asn Leu 
115 120 125 

ttc cac tat teg ctg gcc aag etc ggc ate gag gtc age ttc gtc gac 432 
Phe His Tyr Ser Leu Ala Lys Leu Gly He Glu Val Ser Phe Val Asp 
130 135 140 

gat ccg gac gat ctg gac acc tgg cag gcg gcg gta egg ccc aac acc 4 80 

Asp Pro Asp Asp Leu Asp Thr Trp Gin Ala Ala Val Arg Pro Asn Thr 
145 150 155 160 

aag gcg ttc ttc gcc gag acc ate tec aac ccg cag ate gac ctg ctg 528 
Lys Ala Phe Phe Ala Glu Thr He Ser Asn Pro Gin lie Asp Leu Leu 
165 170 175 

gac acc ccg gcg gtt tec gag gtc gcc cat cgc aac ggg gtg ccg ttg 576 
Asp Thr Pro Ala Val Ser Glu Val Ala His Arg Asn Gly Val Pro Leu 
180 185 190 

ate gtc gac aac acc ate gcc acg cca tac ctg ate caa ccg ttg gcc 624 
lie Val Asp Asn Thr He Ala Thr Pro Tyr Leu He Gin Pro Leu Ala 
195 200 205 

cag ggc gcc gac ate gtc gtg cat teg gcc acc aag tac ctg ggc ggg 672 
Gin Gly Ala Asp He Val Val His Ser Ala Thr Lys Tyr Leu Gly Gly 
210 215 220 

cac ggt gcc gcc ate gcg ggt gtg ate gtc gac ggc ggc aac ttc gat 720 
His Gly Ala Ala He Ala Gly Val He Val Asp Gly Gly Asn Phe Asp 
225 230 235 240 

tgg acc cag ggc cgc ttc ccc ggc ttc acc acc ccc gac ccc age tac 768 
Trp Thr Gin Gly Arg Phe Pro Gly Phe Thr Thr Pro Asp Pro Ser Tyr 
245 250 255 

cac ggc gtg gtg ttc gcc gag ctg ggt cca ccg gcg ttt gcg etc aaa 816 
His Gly Val Val Phe Ala Glu Leu Gly Pro Pro Ala Phe Ala Leu Lys 
260 265 270 

get cga gtg cag ctg etc cgt gac tac ggc teg gcg get teg ccg ttc 864 
Ala Arg Val Gin Leu Leu Arg Asp Tyr Gly Ser Ala Ala Ser Pro Phe 
275 280 285 



aac gcg ttc ttg gtg gcg cag ggt ctg gaa acg ctg age ctg egg ate 
Asn Ala Phe Leu Val Ala Gin Gly Leu Glu Thr Leu Ser Leu Arg He 
290 295 300 



912 
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gag egg cac gtc gec aac gcg cag cgc gtc gec gag ttc ctg gec gec 

Glu Arg His Val Ala Asn Ala Gin Arg Val Ala Glu Phe Leu Ala Ala 

305 ~* 310 315 320 

cgc gac gac gtg ctt teg gtc aac tat gcg ggg ctg ccc tec teg ccc 

Ara Asp Asp Val Leu Ser Val Asn Tyr Ala Gly Leu Pro Ser Ser Pro 
325 330 335 

tgg cat gag egg gec aag agg ctg gcg ccc aag gga acc ggg gee gtg 

Trp His Glu Arg Ala Lys Arg Leu Ala Pro Lys Gly Thr Gly Ala Val 
340 345 350 

ctg tec ttc gag ttg gec ggc ggc ate gag gee ggc aag gca ttc gtg 

Leu Ser Phe Glu Leu Ala Gly Gly lie Glu Ala Gly Lys Ala Phe Val 
355 360 365 

aac gcg ttg aag ctg cac age cac gtc gee aac ate ggt gac gtg cgc 

Asn Ala Leu Lys Leu His Ser His Val Ala Asn lie Gly Asp Val Arg 
370 375 380 

teg ctg gtg ate cac ccg gca teg acc act cat gec cag ctg age ccg 

Ser Leu Val He His Pro Ala Ser Thr Thr His Ala Gin Leu Ser Pro 

385 390 395 400 

gee gag cag ctg gcg acc ggg gtc age ccg ggc ctg gtg cgt ttg get 

Ala Glu Gin Leu Ala Thr Gly Val Ser Pro Gly Leu Val Arg Leu Ala 
405 410 415 

gtg ggc ate gaa ggt ate gac gat ate ctg gee gac ctg gag ctt ggc 

Val Gly He Glu Gly He Asp Asp lie Leu Ala Asp Leu Glu Leu Gly 
420 425 430 

ttt gee gcg gee cgc aga ttc age gee gac ccg cag tec gtg gcg gcg 

Phe Ala Ala Ala Arg Arg Phe Ser Ala Asp Pro Gin Ser Val Ala Ala 
435 ' 440 445 

ttc tga 
Phe 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1296 



1344 



1350 



<210> 4 

<211> 449 

<212> PRT 

<213> Mycobacterium tuberculosis 

<400> 4 

Met Ser Ala Asp Ser Asn Ser Thr Asp Ala Asp Pro Thr Ala His Trp 
n 5 10 15 



Ser Phe Glu Thr Lys Gin He His Ala Gly Gin His Pro Asp Pro Thr 
20 25 30 



Thr Asn Ala Arg Ala Leu Pro He Tyr Ala Thr Thr Ser Tyr Thr Phe 



WO 2004/024933 PCT/EP2003/009453 

8/130 

35 40 45 

Asp Asp Thr Ala His Ala Ala Ala lieu Phe Gly Leu Glu He Pro Gly 
50 55 60 

Asn He Tyr Thr Arg He Gly Asn Pro Thr Thr Asp Val Val Glu Gin 
65 70 75 80 

Arg lie Ala Ala Leu Glu Gly Gly Val Ala Ala Leu Phe Leu Ser Ser 
85 90 95 

Gly Gin Ala Ala Glu Thr Phe Ala He Leu Asn Leu Ala Gly Ala Gly 
100 105 110 

Asp His He Val Ser Ser Pro Arg Leu Tyr Gly Gly Thr Tyr Asn Leu 
115 120 125 

Phe His Tyr Ser Leu Ala Lys Leu Gly He Glu Val Ser Phe Val Asp 
130 135 140 

Asp Pro Asp Asp Leu Asp Thr Trp Gin Ala Ala Val Arg Pro Asn Thr 
145 150 155 160 

Lys Ala Phe Phe Ala Glu Thr He Ser Asn Pro Gin He Asp Leu Leu 
165 170 175 

Asp Thr Pro Ala Val Ser Glu Val Ala His Arg Asn Gly Val Pro Leu 
180 185 190 

He Val Asp Asn Thr He Ala Thr Pro Tyr Leu He Gin Pro Leu Ala 
195 200 205 

Gin Gly Ala Asp He, Val Val His Ser Ala Thr Lys Tyr Leu Gly Gly 
210 215 220 

His Gly Ala Ala He Ala Gly Val He Val Asp Gly Gly Asn Phe Asp 
225 230 235 240 

Trp Thr Gin Gly Arg Phe Pro Gly Phe Thr Thr Pro Asp Pro Ser Tyr 
245 250 255 

His Gly Val Val Phe Ala Glu Leu Gly Pro Pro Ala Phe Ala Leu Lys 
260 265 270 



Ala Arg Val Gin Leu Leu Arg Asp Tyr Gly Ser Ala Ala Ser Pro Phe 
275 280 285 
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Asn Ala Phe Leu Val Ala Gin Gly Leu Glu Thr Leu Ser Leu Arg He 
290 295 300 

Glu Arg His Val Ala Asn Ala Gin Arg Val Ala Glu Phe Leu Ala Ala 
305 310 315 320 

Ara Asp Asp Val Leu Ser Val Asn Tyr Ala Gly Leu Pro Ser Ser Pro 
y 325 330 335 

Trp His Glu Arg Ala Lys Arg Leu Ala Pro Lys Gly Thr Gly Ala Val 
340 345 350 

Leu Ser Phe Glu Leu Ala Gly Gly He Glu Ala Gly Lys Ala Phe Val 
355 360 365 

Asn Ala Leu Lys Leu His Ser His Val Ala Asn He Gly Asp Val Arg 
370 375 380 

Ser Leu Val He His Pro Ala Ser Thr Thr His Ala Gin Leu Ser Pro 
385 390 395 400 

Ala Glu Gin Leu Ala Thr Gly Val Ser Pro Gly Leu Val Arg Leu Ala 
405 410 415 

Val Gly He Glu Gly He Asp Asp He Leu Ala Asp Leu Glu Leu Gly 
420 425 430 

Phe Ala Ala Ala Arg Arg Phe Ser Ala Asp Pro Gin Ser Val Ala Ala 
435 440 445 

Phe 



<210> 5 

<211> 1284 

<212> DNA 

<213> Clostridium acetohutylicum 
<220> 

<221> CDS 

<222> (1) • ■ (1284) 

<223> 
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<400> 5 

atg agt gaa gaa aga aaa ttt ggt ttt gaa aca tta cag gtt cat gca 
Met Ser Glu Glu Arg Lys Phe Gly Phe Glu Thr Leu Gin Val His Ala 



10 15 



tat qqt gga aca tat gaa tta ttt ggg gtt act ctt aag aag ctt gga 
Tyr Gly Gly Thr Tyr Glu Leu Phe Gly Val Thr Leu Lys Lys Leu Gly 
1X5 120 125 

ata aag gtt gtt ttt gta gat cca gat aat cct gaa aat ata aga aaa 
He Lys Val Val Phe Val Asp Pro Asp Asn Pro Glu Asn He Arg Lys 
X30 135 14° 

qca ata aat gat agg aca aaa get gta tat ggg gaa act att gga aat 
Ala He Asn Asp Arg Thr Lys Ala Val Tyr Gly Glu Thr He Gly Asn 
14S 150 1S5 160 

cca aga ata aat gtt ttg gat ata gag gca gta get aaa att gec cat 
Pro Arg He Asn Val Leu Asp He Glu Ala Val Ala Lys He Ala His 



165 



170 175 



aaa aat aaa ata cca ctt ata ate gat aat aca ttt ggt aca ccg tat 
Glu Asn Lys He Pro Leu He He Asp Asn Thr Phe Gly Thr Pro Tyr 

185 190 



180 



qat ggt gga aaa ttt gat tgg aga get agt gga aag ttt cct gat ttt 

Asp 
225 



Asn Gly Gly Lys Phe Asp Trp Arg Ala Ser Gly Lys Phe Pro Asp Phe 
Asp oay v^xy y ^ 235 24Q 



48 



1 5 

gga caa gtt get gat cca act aca gga tea aga get gta cct att tat 

Gly Gin Val Ala Asp Pro Thr Thr Gly Ser Arg Ala Val Pro lie Tyr 
20 25 30 

caa aca aca tea tat gta ttt aaa aat get gat cat gca gca aat tta 
Gin Thr Thr Ser Tyr Val Phe Lys Asn Ala Asp His Ala Ala Asn Leu 
35 40 45 

ttt caa ttg aaa gaa cct gga aat gta tat aca agg ata atg aat cca 
Phe Gin Leu Lys Glu Pro Gly Asn Val Tyr Thr Arg He Met Asn Pro 
50 55 60 

aca act gat gta ttt gaa caa aga gta gca get ctt gag ggc gga gtt 
Thr Thr Asp Val Phe Glu Gin Arg Val Ala Ala Leu Glu Gly Gly Val 
65 70 75 80 

act gga ctt gca aca gca tea gga ctt gca gca att ace tat get att 
Ala Gly Leu Ala Thr Ala Ser Gly Leu Ala Ala He Thr Tyr Ala He 
85 90 95 

tta aat gtg gca agt get ggg gat gaa att gtt gca gca agt ace tta 336 
Leu Asn Val Ala Ser Ala Gly Asp Glu He Val Ala Ala Ser Thr Leu 
100 105 110 



96 



144 



192 



240 



288 



384 



432 



480 



528 



576 



624 



ctt ata aga cct ata gaa ttt gga gca gat ata gtt gta cat tea gca 

Leu He Arg Pro He Glu Phe Gly Ala Asp He Val Val His Ser Ala 

195 200 205 

aca aag ttt ata gga gga cat gga act act ata ggt gga att ata gtt 672 

Thr Lys Phe He Gly Gly His Gly Thr Thr He Gly Gly He He Val 

210 215 220 
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aca aca ccg gat aag age tat aat gga ctt ata tat get gat eta ggt 
Thr Thr Pro Asp Lys Ser Tyr Asn Gly Leu He Tyr Ala Asp Leu Qly 
245 250 255 

gca cct get ttt get tta aaa gca aga gtt caa ctt tta aga aat aca 
Ala Pro Ala Phe Ala Leu Lys Ala Arg Val Gin Leu Leu Arg Asn Thr 
260 265 270 

ggt gca acg ctt agt cca caa agt get ttt tat ttc eta caa ggg ttg 
Glv Ala Thr Leu Ser Pro Gin Ser Ala Phe Tyr Phe Leu Gin Gly Leu 
275 280 28S 

gaa tea ctt tea ctt agg gtt caa aaa cat gtt gat aat aca aga aag 
Glu Ser Leu Ser Leu Arg Val Gin Lys His Val Asp Asn Thr Arg Lys 
290 295 300 

gta gtt gaa ttc ttg aag aac cat cca aaa gtt tea tgg ata aat tat 
Val Val Glu Phe Leu Lys Asn His Pro Lys Val Ser Trp He Asn Tyr 
305 310 315 320 

cct gaa ctt gag gaa agt cct tat aaa gag tta gca aat aaa tat ctt 
Pro Glu Leu Glu Glu Ser Pro Tyr Lys Glu Leu Ala Asn Lys Tyr Leu 
325 330 335 

cca aaa ggt gca ggc tea ata ttt aca ttt gga ata aag gga gga ctt 
III lys Ily Ala lly Ser He Phe Thr Phe Gly He Lys Gly Gly Leu 
340 34S 350 

gaa get ggt aaa aga ttt ata aat agt gtt aaa eta ttc tct ctt ttg 
Ilu Ala Gly Lys Arg Phe He Asn Ser Val Lys Leu Phe Ser Leu Leu 
35S 360 365 

gca aat gtt gca gat gca aaa tea ctt gtt ata cat cct tea agt aca 
III 111 Val Ala Asp Ala Lys Ser Leu Val He His Pro Ser Ser Thr 
370 375 380 

act cat get gaa ctt aat gaa gaa gaa caa aaa gca get ggt gtt act 
Thr His Ala llu Leu Asn Glu Glu Glu Gin Lys Ala Ala Gly Val Thr 
385 390 395 400 

cca gat atg ata aga ctt tea ata gga gta gag gat gca gag gat tta 
Pro Asp Met He Arg Leu Ser He Gly Val Glu Asp Ala Glu Asp Leu 
405 41° 415 

ata tgg gac tta aat caa get etc gaa caa get taa 
He Trp Asp Leu Asn Gin Ala Leu Glu Gin Ala 
420 42S 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1284 



<210> 6 
<211> 427 
<212> PRT 



<213> Clostridium acetobutylicum 



<400> 6 

Met Ser Glu Glu Arg Lys Phe Gly Phe Glu Thr Leu Gin Val His Ala 



WO 2004/024933 flB PCT/EP2003/009453 

12/130 



Gly Gin Val Ala Asp Pro Thr Thr Gly Ser Arg Ala Val Pro He Tyr 
20 25 30 



Gin Thr Thr Ser Tyr Val Phe Lys Asn Ala Asp His Ala Ala Asn Leu 
35 40 45 



Phe Gin Leu Lys Glu Pro Gly Asn Val Tyr Thr Arg He Met Asn Pro 
50 5S 60 



Thr Thr Asp Val Phe Glu Gin Arg Val Ala Ala Leu Glu Gly Gly Val 
65 70 75 80 



Ala Gly Leu Ala Thr Ala Ser Gly Leu Ala Ala He Thr Tyr Ala He 
85 90 95 



Leu Asn Val Ala Ser Ala Gly Asp Glu He Val Ala Ala Ser Thr Leu 
100 105 110 



Tyr Gly Gly Thr Tyr Glu Leu Phe Gly Val Thr Leu Lys Lys Leu Gly 
115 120 125 



He Lys Val Val Phe Val Asp Pro Asp Asn Pro Glu Asn He Arg Lys 
130 135 140 



Ala He Asn Asp Arg Thr Lys Ala Val Tyr Gly Glu Thr He Gly Asn 
145 150 155 160 



Pro Arg He Asn Val Leu Asp He Glu Ala Val Ala Lys He Ala His 
165 170 175 



Glu Asn Lys He Pro Leu He He Asp Asn Thr Phe Gly Thr Pro Tyr 
180 185 190 



Leu He Arg Pro He Glu Phe Gly Ala Asp He Val Val His Ser Ala 
195 200 205 



Thr Lys Phe He Gly Gly His Gly Thr Thr He Gly Gly He He Val 
210 215 220 



Asp Gly Gly Lys Phe Asp Trp Arg Ala Ser Gly Lys Phe Pro Asp Phe 
225 230 235 240 



Thr Thr Pro Asp Lys Ser Tyr Asn Gly Leu He Tyr Ala Asp Leu Gly 
245 250 255 



1 1/1 m 
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Ala Pro Ala Phe Ala Leu Lys Ala Arg Val Gin Leu Leu Arg Asn Thr 
260 265 270 

Gly Ala Thr Leu Ser Pro Gin Ser Ala Phe Tyr Phe Leu Gin Gly Leu 
275 280 2 85 

Glu Ser Leu Ser Leu Arg Val Gin Lys His Val Asp Asn Thr Arg Lys 
290 295 300 

Val Val Glu Phe Leu Lys Asn His Pro Lys Val Ser Trp He Asn Tyr 
305 310 315 320 



Pro Glu Leu Glu Glu Ser Pro Tyr Lys Glu Leu Ala Asn Lys Tyr Leu 
325 330 335 



Pro Lys Gly Ala Gly Ser He Phe Thr Phe Gly He Lys Gly Gly Leu 
340 345 350 



Glu Ala Gly Lys Arg Phe He Asn Ser Val Lys lieu Phe Ser Leu Leu 
355 360 365 

Ala Asn Val Ala Asp Ala Lys Ser Leu Val lie His Pro Ser Ser Thr 
370 375 380 



Thr His Ala Glu Leu Asn Glu Glu Glu Gin Lys Ala Ala Gly Val Thr 
385 390 395 400 

Pro Asp Met He Arg Leu Ser He Gly Val Glu Asp Ala Glu Asp Leu 
405 410 415 

He Trp Asp Leu Asn Gin Ala Leu Glu Gin Ala 
420 425 

<210> 7 
<211> 1293 
<212> DNA 

<213> Bacillus halodurans 
<220> 

<221> CDS 

<222> (D..U293) 

<223> 



WO 2004/024933 
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<400> 7 

atg aat cat gaa aac caa tgg cag tta gaa aca aag gcc gtt cat tea 

Met Asn His Glu Asn Gin Trp Gin Leu Glu Thr Lys Ala Val His Ser 
15 10 15 



48 



gga cag gag ate gat ccg aca acg ttg teg cga gcc gtc cca ttg tac 96 
Gly Gin Glu lie Asp Pro Thr Thr Leu Ser Arg Ala Val Pro Leu Tyr 
20 25 30 



caa acg acg tec tac gga ttt aaa gat aca gac cat gcg gcg aat tta 

Gin Thr Thr Ser Tyr Gly Phe Lys Asp Thr Asp His Ala Ala Asn Leu 

35 40 45 

ttt tea eta agt gaa ttt ggc aat ate tat acc cga ttg atg aac cca 

Phe Ser Leu Ser Glu Phe Gly Asn lie Tyr Thr Arg Leu Met Asn Pro 
50 55 60 

acg aca gat gtg ttt gaa aaa cgt gtg get gcg tta gaa gga gga gcg 

Thr Thr Asp Val Phe Glu Lys Arg Val Ala Ala Leu Glu Gly Gly Ala 
65 70 75 80 

gca get tta gcg acg gcc tea ggg cag gcg gcc att acg tat teg att 

Ala Ala Leu Ala Thr Ala Ser Gly Gin Ala Ala lie Thr Tyr Ser lie 
85 90 95 

tta aat att gcg gag get gga gat gaa ate gtg tec get agt age ctt 

Leu Asn lie Ala Glu Ala Gly Asp Glu lie Val Ser Ala Ser Ser Leu 
10O 105 110 

tac ggc gga acg tat aat tta ttt teg att acg ttg cca aag eta ggg 

Tyr Gly Gly Thr Tyr Asn Leu Phe Ser lie Thr Leu Pro Lys Leu Gly 

115 120 125 

gta aac gtc cgt ttc gtt gat cca teg gac cca gaa aac ttc aaa gca 

Val Asn Val Arg Phe Val Asp Pro Ser Asp Pro Glu Asn Phe Lys Ala 
130 135 140 

gcg att act gaa aag acg aaa gcc att ttc get gag teg att gga aac 

Ala lie Thr Glu Lys Thr Lys Ala He Phe Ala Glu Ser He Gly Asn 
145 ^ 150 155 160 

cct aag gga gac gtg tta gat att gaa gcg gtg gcg aaa gtt gca cac 

Pro Lys Gly Asp Val Leu Asp He Glu Ala Val Ala Lys Val Ala His 
165 170 175 

gat cat cac ctt ccc etc att gtc gat aac acg ttt cca age cca tat 

Asp His His Leu Pro Leu He Val Asp Asn Thr Phe Pro Ser Pro Tyr 
180 185 190 

ttg ctt caa ccg ata aag cac ggc gca gac att gtt gtg cat tea gca 

Leu Leu Gin Pro He Lys His Gly Ala Asp He Val Val His Ser Ala 

195 200 205 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 



aca aaa ttt ate ggt ggt cat ggg acg teg ata gga ggg ate att gtc 672 
Thr Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly He He Val 
210 215 220 



gat gga ggg acg ttt gat tgg gcg aaa acg gat cga tat cca ggg eta 
Asp Gly Gly Thr Phe Asp Trp Ala Lys Thr Asp Arg Tyr Pro Gly Leu 
225 230 235 240 



720 
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aca aca cct gat ccg agt tac cac ggt gtt gta tat aca gat gcg gtc 
Thr Thr Pro Asp Pro Ser Tyr His Gly Val Val Tyr Thr Asp Ala Val 
245 250 255 



768 



ggt cca att get tat att att aaa gcg cgt gtt cag eta ttg cgt gac 

Gly Pro lie Ala Tyr lie lie Lys Ala Arg Val Gin Leu Leu Arg Asp 
260 265 270 

atg ggg gca gec ata teg cca ttt aac teg ttt tta ctg ttg caa ggg 

Met Gly Ala Ala lie Ser Pro Phe Asn Ser Phe Leu Leu Leu Gin Gly 
275 280 285 

ttg gaa acg ttg cat tta egg atg gag aga cat agt gaa aat gee tac 

Leu Glu Thr Leu His Leu Arg Met Glu Arg His Ser Glu Asn Ala Tyr 
290 295 300 

aaa gta gca gag ttc ctt gag caa cat caa gcg gtc gaa teg gtg age 

Lys Val Ala Glu Phe Leu Glu Gin His Gin Ala Val Glu Ser Val Ser 
305 310 315 320 

tac tct gga ctg cca tec cat cca tec tac cca tta gcg aaa aaa tac 

Tyr Ser Gly Leu Pro Ser His Pro Ser Tyr Pro Leu Ala Lys Lys Tyr 

325 330 335 

tta cct aaa ggc caa ggg get ate tta acg ttc gag gta aag ggc ggc 

Leu Pro Lys Gly Gin Gly Ala He Leu Thr Phe Glu Val Lys Gly Gly 
340 345 350 

gtt gaa gca gga aag aaa etc att cat teg gtc cag eta ttc tec cac 

Val Glu Ala Gly Lys Lys Leu He His Ser Val Gin Leu Phe Ser His 
355 3 60 365 

ctt gec aac gta ggt gat tea aaa teg ttg ate ate cat cct gca age 

Leu Ala Asn Val Gly Asp Ser Lys Ser Leu He He His Pro Ala Ser 
370 375 380 

acg ace cac caa cag etc teg gaa gca gaa cag cga gac gca gga gtg 

Thr Thr His Gin Gin Leu Ser Glu Ala Glu Gin Arg Asp Ala Gly Val 
385 390 395 400 

aca cct ggg atg ate aga ctt teg gta gga ace gaa teg att cat gat 

Thr Pro Gly Met He Arg Leu Ser Val Gly Thr Glu Ser He His Asp 

405 410 415 

att ate acc gat etc aaa cag gcg att gag gcg agt caa gcg taa 

He He Thr Asp Leu Lys Gin Ala He Glu Ala Ser Gin Ala 
420 425 430 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1293 



<210> 8 

<211> 430 

<212> PRT 

<213> Bacillus halodurans 



<400> 8 



Met Asn His Glu Asn Gin Trp Gin Leu Glu Thr Lys Ala Val His Ser 
! " 5 10 15 
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Gly Gin Glu He Asp Pro Thr Thr Leu Ser Arg Ala Val Pro Leu Tyr 
20 25 30 

Gin Thr Thr Ser Tyr Gly Phe Lys Asp Thr Asp His Ala Ala Asn Leu 
3 5 40 45 

Phe Ser Leu Ser Glu Phe Gly Asn He Tyr Thr Arg Leu Met Asn Pro 
50 55 60 

Thr Thr Asp Val Phe Glu Lys Arg Val Ala Ala Leu Glu Gly Gly Ala 
65 70 75 80 

Ala Ala Leu Ala Thr Ala Ser Gly Gin Ala Ala He Thr Tyr Ser He 
85 90 95 

Leu Asn He Ala Glu Ala Gly Asp Glu He Val Ser Ala Ser Ser Leu 
100 105 HO 

Tyr Gly Gly Thr Tyr Asn Leu Phe Ser He Thr Leu Pro Lys Leu Gly 
115 120 125 

Val Asn Val Arg Phe Val Asp Pro Ser Asp Pro Glu Asn Phe Lys Ala 
130 135 140 

Ala He Thr Glu Lys Thr Lys Ala He Phe Ala Glu Ser He Gly Asn 
145 150 155 160 

Pro Lys Gly Asp Val Leu Asp He Glu Ala Val Ala Lys Val Ala His 
165 170 175 

Asp His His Leu Pro Leu He Val Asp Asn Thr Phe Pro Ser Pro Tyr 
180 185 190 

Leu Leu Gin Pro He Lys His Gly Ala Asp He Val Val His Ser Ala 
195 200 205 

Thr Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly He He Val 
210 215 220 

Asp Gly Gly Thr Phe Asp Trp Ala Lys Thr Asp Arg Tyr Pro Gly Leu 
22 5 230 235 240 

Thr Thr Pro Asp Pro Ser Tyr His Gly Val Val Tyr Thr Asp Ala Val 
245 250 255 



Pro He Ala Tyr He He Lys Ala Arg Val Gin Leu Leu Arg Asp 
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260 265 270 



Met Gly Ala Ala lie Ser Pro Phe Asn Ser Phe Leu Leu Leu Gin Gly 
275 280 285 



Leu Glu Thr Leu His Leu Arg Met Glu Arg His Ser Glu Asn Ala Tyr 
290 295 300 

Lys Val Ala Glu Phe Leu Glu Gin His Gin Ala Val Glu Ser Val Ser 
305 310 315 320 

Tyr Ser Gly Leu Pro Ser His Pro Ser Tyr Pro Leu Ala Lys Lys Tyr 
325 330 335 

Leu Pro Lys Gly Gin Gly Ala He Leu Thr Phe Glu Val Lys Gly Gly 
340 345 350 

Val Glu Ala Gly Lys Lys Leu He His Ser Val Gin Leu Phe Ser His 
355 360 365 

Leu Ala Asn Val Gly Asp Ser Lys Ser Leu He He His Pro Ala Ser 
370 375 380 

Thr Thr His Gin Gin Leu Ser Glu Ala Glu Gin Arg Asp Ala Gly Val 
385 390 395 400 

Thr Pro Gly Met He Arg Leu Ser Val Gly Thr Glu Ser lie' His Asp 
4 05 410 415 

He He Thr Asp Leu Lys Gin Ala He Glu Ala Ser Gin Ala 
420 425 430 



<210> 9 

<211> 1203 

<212> DNA 

<213> Bacillus stearothermophilus 
<220> 

<221> CDS 

<222> (1) (1203) 

<223> 



WO 2004/024933 
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<400> 9 

atg teg tat gta ttc cgc gac age gag cac gcg gee aat ttg ttt ggt 48 

Met Ser Tyr Val Phe Arg Asp Ser Glu His Ala Ala Asn Leu Phe Gly 
1 5 10 15 

ttg aaa gag gaa ggt ttt att tat aeg cgc att atg aat cca acg aac 96 
Leu Lys Glu Glu Gly Phe lie Tyr Thr Arg lie Met Asn Pro Thr Asn 
20 25 30 

gac gtg ttc gaa aag egg ate gcg gcg ctt gaa ggc ggc att ggg gcg 144 
Asp Val Phe Glu Lys Arg lie Ala Ala Leu Glu Gly Gly He Gly Ala 
35 40 45 

etc gcg ctg tea teg ggg cag gcg gcg gtg ttt tat teg ate ate aac 192 
Leu Ala Leu Ser Ser Gly Gin Ala Ala Val Phe Tyr Ser He He Asn 
50 55 60 

ate gee teg gcg ggc gat gaa ate gtc teg tct teg tec att tac ggc 240 
lie Ala Ser Ala Gly Asp Glu He Val Ser Ser Ser Ser He Tyr Gly 
65 70 75 80 

gga acg tac aac ttg ttc gee cat acg ctg cgc aag ttc ggc att acg 288 
Gly Thr Tyr Asn Leu Phe Ala His Thr Leu Arg Lys Phe Gly He Thr 
85 90 95 

gtg aag ttt gtc gat ccg tec gac ccc gaa aac ttt gag egg gcg ate 336 
Val Lys Phe Val Asp Pro Ser Asp Pro Glu Asn Phe Glu Arg Ala He 
100 105 110 

acc gac aaa acg aaa gee ttg ttt gcg gaa acg ate ggc aac ccg aaa 384 
Thr Asp Lys Thr Lys Ala Leu Phe Ala Glu Thr He Gly Asn Pro Lys 
115 120 125 

aac gat gtg ttg gac att gaa gcg gtg gee gac ate gee cat cgc cat 432 
Asn Asp Val Leu Asp He Glu Ala Val Ala Asp He Ala His Arg His 
130 135 140 

gee att ccg etc att gtc gac aac acg gtg gec agt cca tac tta ttg 480 
Ala He Pro Leu He Val Asp Asn Thr Val Ala Ser Pro Tyr Leu Leu 
145 150 155 160 

egg ccg att gaa ttc ggc gee gat ate gtc gtc cac tea gcg acg aag 528 
Arg Pro He Glu Phe Gly Ala Asp lie Val Val His Ser Ala Thr Lys 
165. 170 175 

ttc ate ggc ggg cac ggc aat teg ate ggc ggt gtg att gtg gac age 576 
Phe He Gly Gly His Gly Asn Ser He Gly Gly Val He Val Asp Ser 
180 185 190 

ggc aag ttt gac tgg aaa ggg age ggc aag ttt ccg gag ttc acc gag 624 
Gly Lys Phe Asp Trp Lys Gly Ser Gly Lys Phe Pro Glu Phe Thr Glu 
195 200 205 

cca gac cca age tac cac ggt ttg gtg tat gtg gac gee gtc ggc gaa 672 
Pro Asp Pro Ser Tyr His Gly Leu Val Tyr Val Asp Ala Val Gly Glu 
210 215 220 

gcg gcg tac ate acg aaa gcg cgc ate cag etc ttg cgc gat ttg gga 720 
Ala Ala Tyr He Thr Lys Ala Arg He Gin Leu Leu Arg Asp Leu Gly 
225 230 ™ 235 240 

gcg gcg ttg teg ccg ttt aat gcg ttt ttg ctt ttg caa ggg ttg gag 768 
Ala Ala Leu Ser Pro Phe Asn Ala Phe Leu Leu Leu Gin Gly Leu Glu 
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245 250 255 

acg etc cat ttg egg atg cag cgc cat age gaa aac gee ctt gec gtc 
Thr Leu His Leu Arg Met Gin Arg His Ser Glu Asn Ala Leu Ala Val 
260 265 270 

gee aag ttt tta gaa gag gaa gaa gcg gtc gaa teg gtc aat tac cca 
Ala Lys Phe Leu Glu Glu Glu Glu Ala Val Glu Ser Val Asn Tyr Pro 
275 280 285 

ggg ctt ccg age cat ccg teg cat gaa ctg gcg aaa aaa tat ttg cca 
Gly Leu Pro Ser His Pro Ser His Glu Leu Ala Lys Lys Tyr Leu Pro 
290 295 300 

aac ggg caa gga gcg ate gtc acg ttt gaa ate aaa ggc ggc gtc gaa 
Asn Gly Gin Gly Ala lie Val Thr Phe Glu lie Lys Gly Gly Val Glu 
305 310 315 320 

gee ggc aaa aaa ctg ate gac teg gtc aaa ctg ttc tct cat ttg gee 
Ala Gly Lys Lys Leu lie Asp Ser Val Lys Leu Phe Ser His Leu Ala 
325 330 335 

aac ate ggc gat teg aaa teg etc ate ate cac ccg gee age aca acg 
Asn lie Gly Asp Ser Lys Ser Leu lie lie His Pro Ala Ser Thr Thr 
340 345 350 

cac gag cag ctg age cca gat gaa cag ctg tec gee ggc gtc ace cca 
His Glu Gin Leu Ser Pro Asp Glu Gin Leu Ser Ala Gly Val Thr Pro 
355 360 365 

ggc ctt gtg cgt ctg tec gtc ggc aca gaa gcg ate gac gac att ttg 
Gly Leu Val Arg Leu Ser Val Gly Thr Glu Ala lie Asp Asp lie Leu 
370 375 380 

gac gac ttg cgc caa gee att cgc caa age cag acg gtg ggg gtg aag 
Asp Asp Leu Arg Gin Ala lie Arg Gin Ser Gin Thr Val Gly Val Lys 
385 390 395 400 

tag 



<210> 10 

<211> 400 

<212> PRT 

<213> Bacillus stearothermophilus 

<400> 10 

Met Ser Tyr Val Phe Arg Asp Ser Glu His Ala Ala Asn Leu Phe Gly 
! 5 10 15 

Leu Lys Glu Glu Gly Phe lie Tyr Thr Arg lie Met Asn Pro Thr Asn 
20 25 30 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 



1203 



Asp Val Phe Glu Lys Arg lie Ala Ala Leu Glu Gly Gly lie Gly Ala 
35 40 45 
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Leu Ala Leu Ser Ser Gly Gin Ala Ala Val Phe Tyx Ser lie lie Asn 
50 55 60 

lie Ala Ser Ala Gly Asp Glu lie Val Ser Ser Ser Ser He Tyr Gly 
65 70 75 80 



Gly Thr Tyr Asn Leu Phe Ala His Thr Leu Arg Lys Phe Gly He Thr 
85 90 95 



Val Lys Phe Val Asp Pro Ser Asp Pro Glu Asn Phe Glu Arg Ala lie 
100 105 110 



Thr Asp Lys Thr Lys Ala Leu Phe Ala Glu Thr He Gly Asn Pro Lys 
115 120 125 

Asn Asp Val Leu Asp He Glu Ala Val Ala Asp He Ala His Arg His 
130 135 140 

Ala He Pro Leu He Val Asp Asn Thr Val Ala Ser Pro Tyr Leu Leu 
145 150 155 160 

Arg Pro He Glu Phe Gly Ala Asp He Val Val His Ser Ala Thr Lys 
165 170 175 



Phe He Gly Gly His Gly Asn Ser He Gly Gly Val He Val Asp Ser 
180 185 190 

Gly Lys Phe Asp Trp Lys Gly Ser Gly Lys Phe Pro Glu Phe Thr Glu 
195 200 205 

Pro Asp Pro Ser Tyr His Gly Leu Val Tyr Val Asp Ala Val Gly Glu 
210 215 220 



Ala Ala Tyr He Thr Lys Ala Arg He Gin Leu Leu Arg Asp Leu Gly 
225 230 235 240 

Ala Ala Leu Ser Pro Phe Asn Ala Phe Leu Leu Leu Gin Gly Leu Glu 
245 250 255 



Thr Leu His Leu Arg Met Gin Arg His Ser Glu Asn Ala Leu Ala Val 
260 265 270 



Ala Lys Phe Leu Glu Glu Glu Glu Ala Val Glu Ser Val Asn Tyr Pro 
275 280 285 
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Asn He Gly Asp Ser Lys Ser Leu He He His Pro Ala Ser Thr Thr 
340 345 350 



His Glu Gin Leu Ser Pro Asp Glu Gin Leu Ser Ala Gly Val Thr Pro 
355 360 365 

Gly Leu Val Arg Leu Ser Val Gly Thr Glu Ala He Asp Asp He Leu 
370 375 380 

Asp Asp Leu Arg Gin Ala He Arg Gin Ser Gin Thr Val Gly Val Lys 

<210> H 

<211> 1290 

<212> DNA 

<213> Chlorobium tepidum 



<220> 

<221> CDS 

<222> (1) . - (1290) 

<223> 



<400> 11 AQ 

atq agt gag gat aac acc ttc egg ttc gag acc ttg cag gtt cac gec 48 

M^t ser Glu Asp Asn Thr Phe Arg Phe Glu Thr Leu Gin Val His Ala 

Met: £>e ^ ^ ^ 15 

aaa cag gag cct gat ccg gtg acc gga teg cgc gee gtg ccc att tac 96 

Glv Gin Glu Pro Asp Pro Val Thr Gly Ser Arg Ala Val Pro He Tyr 

20 25 30 



cag acc acc tec tac gtg ttc gag aac gee gag cac ggc get gac ctg 
Gin Thr Thr Ser Tyr Val Phe Glu Asn Ala Glu His Gly Ala Asp Leu 
35 40 45 



144 



ttc gcg ctt cgc aag gcg ggc aat ate tac acg cgc ctg atg aac ccg 192 
Phe Ala Leu Arg Lys Ala Gly Asn He Tyr Thr Arg Leu Met Asn Pro 
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50 55 60 

acc acc gac gtg etc gaa aag cgc atg gcg gcg etc gaa ggg ggc aag 240 
Thr Thr Asp Val Leu Glu Lys Arg Met Ala Ala Leu Glu Gly Gly Lys 
65 70 .75 80 

gcg gec etc ggc gtg gcg age ggc cac teg gcg cag ttc ate get att 288 
Ala Ala Leu Gly Val Ala Ser Gly His Ser Ala Gin Phe lie Ala lie 
85 90 95 

gec acc ate tgc cag get gga gac aac att gtg tea teg age tat etc 336 
Ala Thx lie Cys Gin Ala Gly Asp Asn lie Val Ser Ser Ser Tyr Leu 
100 105 110 

tac ggc ggc acc tac aac cag ttc aag gtc gec ttc aag cgc etc ggc 3 84 

Tyr Gly Gly Thr Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly 
115 12 0 125 

ate gag gtg agg ttc gtg gat ggc aac gat cag gag gcg ttc cgc aag 432 
lie Glu Val Arg Phe Val Asp Gly Asn Asp Gin Glu Ala Phe Arg Lys 
130 135 140 

get ate gac gag aac acg aaa gcg etc tac atg gag tec age ggc aat 4 80 

Ala lie Asp Glu Asn Thr Lys Ala Leu Tyr Met Glu Ser Ser Gly Asn 
145 150 155 160 

ccg gcg ttc cat gtg ccc gat ttc gac get ate gcg aag att gec cgt 528 
Pro Ala Phe His Val Pro Asp Phe Asp Ala lie Ala Lys He Ala Arg 
165 170 175 

gag aac ggc att ccg ctg ate gtc gat aac acc ttt ggc tgc gcg ggc 576 
Glu Asn Gly He Pro Leu lie Val Asp Asn Thr Phe Gly Cys Ala Gly 
180 185 190 

tat etc tgc cgt ccc att gat cac ggc gcg teg ate gtg gtc gag teg 624 
Tyr Leu Cys Arg Pro lie Asp His Gly Ala Ser He Val Val Glu Ser 
195 200 205 

gec acc aag tgg ate ggc ggg cac ggc acc teg atg ggc ggc ate ate 672 
Ala Thr Lys Trp He Gly Gly His Gly Thr Ser Met Gly Gly He He 
210 215 220 

gtc gat gee gga acg ttc gac tgg ggc aac ggc aag ttt ccg etc ttt 720 
Val Asp Ala Gly Thr Phe Asp Trp Gly Asn Gly Lys Phe Pro Leu Phe 
225 230 235 240 

acc gag cca teg gaa ggc tat cac ggc ctg aaa ttc tac gaa gcg gtc 768 
Thr Glu Pro Ser Glu Gly Tyr His Gly Leu Lys Phe Tyr Glu Ala Val 
245 250 255 

ggc gag ctg gee ttt ate ate egg gcg egg gtc gag gga ctg egg gat 816 
Gly Glu Leu Ala Phe He He Arg Ala Arg Val Glu Gly Leu Arg Asp 
260 265 270 

ttc ggc ccg gcg ate age ccg ttc aac tec ttc atg ctg ttg cag gga 864 
Phe Gly Pro Ala He Ser Pro Phe Asn Ser Phe Met Leu Leu Gin Gly 
275 280 285 



ctt gaa acg etc teg ctt cgc gtg cag cgc cac etc gac aac acg ctt 
Leu Glu Thr Leu Ser Leu Arg Val Gin Arg His Leu Asp Asn Thr Leu 
290 295 300 



912 



gaa ctg gec cgc tgg etc gaa agg cac gat gcg gtt gcg tgg gtg aac 960 
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Glu Leu Ala Arg Trp Leu Glu Arg His Asp Ala Val Ala Trp Val Asn 
305 310 315 320 

tat cca ggc etc gaa age cat ccg aca cac gec ctg gca aaa aaa tat 
Tvr Pro Gly Leu Glu Ser His Pro Thr His Ala Leu Ala Lys Lys Tyr 
* 325 330 335 

etc acg cat ggc ttc ggc tgc gtg ctg act ttc ggc gtg aag ggt ggt 
Leu Thr His Gly Phe Gly Cys Val Leu Thr Phe Gly Val Lys Gly Gly 
340 34S 350 

tat gaa aac gcg gtg aag ttc ate gac age gtg aag ctg gcg age cac 
Tyr Glu Asn Ala Val Lys Phe lie Asp Ser Val Lys Leu Ala Ser His 
355 360 365 

ctg gec aac gtg ggt gat gca aaa acg etc gtc att cat ccg gca teg 
Leu Ala Asn Val Gly Asp Ala Lys Thr Leu Val lie His Pro Ala Ser 
370 375 380 

acg acg cac cag cag etc age gec gag gaa cag gta teg gcg ggc gtc 
Thr Thr His Gin Gin Leu Ser Ala Glu Glu Gin Val Ser Ala Gly Val 
385 390 395 400 

acc gec gat atg gtg cgc gtg teg gtt ggt ate gag cat ate gat gac 
Thr Ala Asp Met Val Arg Val Ser Val Gly lie Glu His lie Asp Asp 
405 410 415 

ate aag get gat ttc age cag get ttc gag aat tta gca tga 
lie Lys Ala Asp Phe Ser Gin Ala Phe Glu Asn Leu Ala 
420 425 



1008 



1056 



1104 



1152 



1200 



1248 



1290 



<210> 12 

<211> 429 

<212> PRT 

<213> Chlorobium tepidum 

<400> 12 

Met Ser Glu Asp Asn Thr Phe Arg Phe Glu Thr Leu Gin Val His Ala 
- 5 10 15 



Glv Gin Glu Pro Asp Pro Val Thr Gly Ser Arg Ala Val Pro lie Tyr 

•* ~- 30 



20 



25 



Gin Thr Thr Ser Tyr Val Phe Glu Asn Ala Glu His Gly Ala Asp Leu 
35 40 45 

Phe Ala Leu Arg Lys Ala Gly Asn He Tyr Thr Arg Leu Met Asn Pro 

50 55 6° 



Thr Thr Asp Val Leu Glu Lys Arg Met Ala Ala Leu Glu Gly Gly Lys 
g5 70 75 80 
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Ala Ala Leu Gly Val Ala Ser Gly His Ser Ala Gin Phe He Ala He 
85 90 95 



Ala Thr He Cys Gin Ala Gly Asp Asn He Val Ser Ser Ser Tyr Leu 
100 105 110 



Tyr Gly Gly Thr Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly 
115 120 125 



He Glu Val Arg Phe Val Asp Gly Asn Asp Gin Glu Ala Phe Arg Lys 
130 135 140 

Ala He Asp Glu Asn Thr Lys Ala Leu Tyr Met Glu Ser Ser Gly Asn 
145 150 155 160 

Pro Ala Phe His Val Pro Asp Phe Asp Ala He Ala Lys He Ala Arg 
165 170 175 



Glu Asn Gly He Pro Leu He Val Asp Asn Thr Phe Gly Cys Ala Gly 
180 185 190 

Tyr Leu Cys Arg Pro He Asp His Gly Ala Ser He Val Val Glu Ser 
195 200 205 

Ala Thr Lys Trp He Gly Gly His Gly Thr Ser Met Gly Gly He He 
210 215 220 

Val Asp Ala Gly Thr Phe Asp Trp Gly Asn Gly Lys Phe Pro Leu Phe 
225 230 235 240 

Thr Glu Pro Ser Glu Gly Tyr His Gly Leu Lys Phe Tyr Glu Ala Val 
245 250 255 



Gly Glu Leu Ala Phe He He Arg Ala Arg Val Glu Gly Leu Arg Asp 
260 265 270 



Phe Gly Pro Ala He Ser Pro Phe Asn Ser Phe Met Leu Leu Gin Gly 
275 280 285 

Leu Glu Thr Leu Ser Leu Arg Val Gin Arg His Leu Asp Asn Thr Leu 
290 295 300 

Glu Leu Ala Arg Trp Leu Glu Arg His Asp Ala Val Ala Trp Val Asn 
305 310 315 320 



Tyr Pro Gly Leu Glu Ser His Pro Thr His Ala Leu Ala Lys Lys Tyr 
325 330 335 
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Leu Thr His Gly Phe Gly Cys Val Leu Thr Phe Gly Val Lys Gly Gly 
340 345 350 

Tyr Glu Asn Ala Val Lys Phe He Asp Ser Val Lys Leu Ala Ser His 
355 360 365 

Leu Ala Asn Val Gly Asp Ala Lys Thr Leu Val He His Pro Ala Ser 
370 375 380 

Thr Thr His Gin Gin Leu Ser Ala Glu Glu Gin Val Ser Ala Gly Val 
385 390 395 400 

Thr Ala Asp Met Val Arg Val Ser Val Gly He Glu His He Asp Asp 
405 410 415 

He Lys Ala Asp Phe Ser Gin Ala Phe Glu Asn Leu Ala 
420 425 



<210> 13 

<211> 1281 

<212> DNA 

<213> Lactococcus lactis 
<220> 

<221> CDS 

<222> (1) . - (1281) 

<223> 



<400> 13 

atg act aat cac aat tat aaa ttc gac act ttg caa gtc cat gca gga 
Met Thr Asn His Asn Tyr Lys Phe Asp Thr Leu Gin Val His Ala Gly 
1 5 10 15 

caa gtc cct gat cct gtc acg ggt tea cgc gec gtt ccg etc tat caa 
Gin Val Pro Asp Pro Val Thr Gly Ser Arg Ala Val Pro Leu Tyr Gin 
20 25 30 

aca act tct ttc gtt ttt aac aat tea gac cat gec gaa get cgt ttt 
Thr Thr Ser Phe Val Phe Asn Asn Ser Asp His Ala Glu Ala Arg Phe 
35 40 45 

get tta caa gat cct gga get att tat tea cgt tta gga aat cca acc 
Ala Leu Gin Asp Pro Gly Ala He Tyr Ser Arg Leu Gly Asn Pro Thr 
50 55 60 



48 



96 



144 



192 



WO 2004/024933 PCT/EP2003/009453 

26/130 

aac gat gtt ttt gaa gca cgc ate gca get ctt gaa ggt gga agt gca 240 
Asn Asp Val Phe Glu Ala Arg lie Ala Ala Leu Glu Gly Gly Ser Ala 
65 70 75 80 

gec ctt ggt gtt ggt tct ggc tea gee get att acc tat gee ate ttg 288 
Ala Leu Gly Val Gly Ser Gly Ser Ala Ala lie Thr Tyr Ala lie Leu 
85 90 95 

aat ate get aca gtc ggt gat aat att gtt tec gca agt acc ctt tat 336 
Asn lie Ala Thr Val Gly Asp Asn lie Val Ser Ala Ser Thr Leu Tyr 
100 105 110 

ggt gga acc tat cac ctt ttt tct ggg act tta cca aaa tat gga att 384 
Gly Gly Thr Tyr His Leu Phe Ser Gly Thr Leu Pro Lys Tyr Gly He 
115 120 125 

aca act aaa ttt gtc aat cca gat gac ccg aag aat ttt gaa gag gcg 432 
Thr Thr Lys Phe Val Asn Pro Asp Asp Pro Lys Asn Phe Glu Glu Ala 
130 135 140 

att gat gaa aaa acc aaa get att tat tat gaa act ttg ggc aat ccg 480 
He Asp Glu Lys Thr Lys Ala He Tyr Tyr Glu Thr Leu Gly Asn Pro 
145 150 155 160 

gga aat aat gtg att gat tat gat gec att ggt caa att get aaa aaa 52 8 

Gly Asn Asn Val He Asp Tyr Asp Ala He Gly Gin He Ala Lys Lys 
165 170 175 



cat gga att ccc gtt att gtt gat gca acg ttt act acc cct gtg acc 
His Gly He Pro Val He Val Asp Ala Thr Phe Thr Thr Pro Val Thr 
180 185 190 



576 



ttt aaa cca ttt gaa cat ggt get aat gta att gtt cat tea gca acg 624 
Phe Lys Pro Phe Glu His Gly Ala Asn Val He Val His Ser Ala Thr 
195 200 205 

aaa ttc att ggc ggt cat ggt act tct att ggt gga gtc ate gtt gat 672 
Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly Val He Val Asp 
210 215 220 

ggc gga aac ttt gat tgg gca aat ggt aat ttt cct gat ttt aca caa 720 
Gly Gly Asn Phe Asp Trp Ala Asn Gly Asn Phe Pro Asp Phe Thr Gin 
225 ■ 230 235 240 

get gat gaa age tac aat ggg att aaa ttt gee gaa ttg ggt gaa att 768 
Ala Asp Glu Ser Tyr Asn Gly He Lys Phe Ala Glu Leu Gly Glu He 
245 250 255 

get ttt gtg act egg gtt aga get att tta tta cgt gat acg ggt gcg 816 
Ala Phe Val Thr Arg Val Arg Ala He Leu Leu Arg Asp Thr Gly Ala 
260 265 270 

get tta tea cct ttt cat tct tgg ctt ttc tta cag ggg eta gaa aca 864 
Ala Leu Ser Pro Phe His Ser Trp Leu Phe Leu Gin Gly Leu Glu Thr 
275 280 285 



etc tea etc egg gta gaa cgt cac ate tec aat act aaa aag att gta 
Leu Ser Leu Arg Val Glu Arg His He Ser Asn Thr Lys Lys He Val 
290 295 300 



912 



WO 2004/024933 



27/130 



/EP2003/009453 



caa ttt tta gac aat cat cct aag gtg gaa ctt gtt aac cat cct ctg 
Glu Phe £u As P Asn His Pro Hys Val Glu Leu Val Asn Hxs Pro Leu 
305 310 315 

*. Hah rai- aca etc tat cag aaa tat tat cca aaa 

K £ » s« £ 25 IS Tyr oil Iiys Tyr Tyr Pro ,y. 

325 330 

tct ate ttt acc ttt gaa etc aaa gac aaa gat gag aaa 
As* Hy sll ztl Phe Thr Phe llu Leu Lys Asp Lys Asp Glu Lys 

340 345 

■ _»-*. „ah cat ctt aaa att ttc tea ctt eta gee 

£ Si £ Sp - "« S £ - «« "« - §s — — ua 

355 360 

_„ _ aa tca tta dec att cat cct get teg acc act 

ss s K s s: £ ^ La xi e Hi s « s er ^ Thr 

370 375 380 

„=„ eta aat acc gaa gaa ctt get agt gca ggg att tec aaa 

K S Sin 2 Sn Ala Glu Glu Leu Ala Ser Ala Gly He Ser Lys 
385 390 395 

tta tea att got att gaa gat gta act gac ttg att 
III S S5 £ 2: s2 SS S!y Xie Slu «, V.! «. ASP je« n. 

405 410 

get gat tta gag caa gca tta gaa aaa ata taa 
Ala Asp Leu Glu Gin Ala Leu Glu Lys He 
420 425 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1281 



<210> 14 
<2H> 426 
<212> PRT 



<213> Lactococcus lactis 



<400> 14 

Met Thr Asn His Asn Tyr Lys Phe Asp Thr Leu Gin Val His Ala Gly 
1 5 



Gin val Pro Asp Pro Val Thr Gly Ser Arg Ala Val Pro Leu Tyr Gin 
20 25 



Thr Thr Ser Phe Val Phe Asn Asn Ser Asp His Ala Glu Ala Arg Phe 
35 40 45 



Ala Leu 
50 



Gin Asp Pro Gly Ala He Tyr Ser Arg Leu Gly Asn Pro Thr 
55 60 



Asn Asp 



Val Phe Glu Ala Arg He Ala Ala Leu Glu Gly Gly Ser Ala 
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65 70 75 80 

Ala Leu Gly Val Gly Ser Gly Ser Ala Ala lie Thr Tyr Ala lie Leu 
85 90 95 

Asn lie Ala Thr Val Gly Asp Asn lie Val Ser Ala Ser Thr Leu Tyr 
100 105 110 

Gly Gly Thr Tyr His Leu Phe Ser Gly Thr Leu Pro Lys Tyr Gly lie 
115 120 125 

Thr Thr Lys Phe Val Asn Pro Asp Asp Pro Lys Asn Phe Glu Glu Ala 
130 135 ^ 140 

lie Asp Glu Lys Thr Lys Ala lie Tyr Tyr Glu Thr Leu Gly Asn Pro 
145 150 155 160 

Gly Asn Asn Val lie Asp Tyr Asp Ala He Gly Gin He Ala Lys Lys 
165 170 ~ 175 

His Gly He Pro Val He Val Asp Ala Thr Phe Thr Thr Pro Val Thr 
180 185 190 

Phe Lys Pro Phe Glu His Gly Ala Asn Val He Val His Ser Ala Thr 
195 200 205 

Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly Val He Val Asp 
210 215 220 

Gly Gly Asn Phe Asp Trp Ala Asn Gly Asn Phe Pro Asp Phe Thr Gin 
225 230 235 240 

Ala Asp Glu Ser Tyx Asn Gly He Lys Phe Ala Glu Leu Gly Glu He 
245' 250 255 

Ala Phe Val Thr Arg Val Arg Ala He Leu Leu Arg Asp Thr Gly Ala 
260 265 270 

Ala Leu Ser Pro Phe His Ser Trp Leu Phe Leu Gin Gly Leu Glu Thr 
275 280 285 

Leu Ser Leu Arg Val Glu Arg His He Ser Asn Thr Lys Lys He Val 
290 295 300 



Glu Phe Leu Asp Asn His Pro Lys Val Glu Leu Val Asn His Pro Leu 
30S 310 315 320 
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Leu Glu ser Asn Ser Tyr His Ala Leu Tyr Gin Lys Tyr Tyr Pro Lys 
325 330 



Asp Ala Gly Ser He Phe Thr Phe Glu Leu Lys Asp Lys Asp Glu Lys 
340 345 

Lys Ala Arg Asp Leu He Asp His Leu Glu He Phe Ser Leu Leu Ala 
355 360 

Asn Val Gly Asp Thr Lys Ser Leu Ala He His Pro Ala Ser Thr Thr 
370 375 

His Gin Gin Leu Asn Ala Glu Glu Leu Ala Ser Ala Gly He Ser Lys 
385 390 39 

Gly Thr He Arg Leu Ser Val Gly He Glu Asp Val Thr Asp Leu He 



405 



Ala Asp Leu 



Glu Gin Ala Leu Glu Lys He 
420 425 



<210> 15 

<211> H73 

<212> DNA 

<213> Synechococcus sp. 

<220> 

<221> CDS 

<222> (1) . ■ (H73) 

<223> 



asa s £ a = = = ? - K ~ = = 

„_ „ t acc aaa aCQ qtq ccg att tat cag acc age tec 
S S E Thr £» 5. 2 9 L! ?•! PrI He Tyr S1 n Thr ser Ser 
20 25 

t-t-c aac qac gec gag cac ggc gec aac ctg ttt gga ctg aag 
5£ III Phe Asn Zp Si. Si! His Sy Ala Asn Leu Phe Gly Leu Lys 

»mm i-fce aac aac ate tac acc cgt ctg atg aac ccg acg acg gat gtg 
SS Phe Sy Asn He Tyr Thr Arg Leu Met Asn Pro Thr Thr Asp Val 



48 



96 



144 



192 
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50 55 60 

ttc gag aag egg gtg gcg gec ctg gaa ggg ggt gtg gec gcg ctg gec 240 
Phe Glu Lys Arg Val Ala Ala Leu Glu Gly Gly Val Ala Ala Leu Ala 
65 70 75 80 



aca gec tec ggt cag teg get cag ttc ctg gcg ate acg aat tgc atg 
Thr Ala Ser Gly Gin Ser Ala Gin Phe Leu Ala lie Thr Asn Cys Met 
85 90 95 



288 



cag gca ggg gat aac ttt gtg tec acg teg ttc ctt tac ggc ggc acc 336 
Gin Ala Gly Asp Asn Phe Val Ser Thr Ser Phe Leu Tyr Gly Gly Thr 
100 105 110 

tac aac cag ttc aaa gtg caa ttc ccc egg ctg ggc ate gac gtg cgc 384 
Tyr Asn Gin Phe Lys Val Gin Phe Pro Arg Leu Gly lie Asp Val Arg 
115 120 125 

ttc get gat ggc gac gac gtg gag age ttt get gcg cag ate gac gac 432 
Phe Ala Asp Gly Asp Asp Val Glu Ser Phe Ala Ala Gin lie Asp Asp 
130 135 140 

aaa acc aaa ggc etc tac gtc gaa gcg atg ggc aat cca cgc ttc aac 480 
Lys Thr Lys Gly Leu Tyr Val Glu Ala Met Gly Asn Pro Arg Phe Asn 
145 150 155 160 

ate ccc gat ttc gag ggc etc tea gec ctg get aaa gag cgc ggc ate 528 
lie Pro Asp Phe Glu Gly Leu Ser Ala Leu Ala Lys Glu Arg Gly lie 
165 170 175 

cca ttg ate gtg gac aac acc ttg gga get tgc ggt gec ctg atg cgt 576 
Pro Leu He Val Asp Asn Thr Leu Gly Ala Cys Gly Ala Leu Met Arg 
180 185 190 

ccg ate gat cat ggc gcg gat gtg gtg gtg gaa age gec acc aag tgg 624 
Pro He Asp His Gly Ala Asp Val Val Val Glu Ser Ala Thr Lys Trp 
195 200 205 

att ggc ggc cat ggc acc age etc ggt ggc gtg ate gtt gat gee ggc 672 
He Gly Gly His Gly Thr Ser Leu Gly Gly Val He Val Asp Ala Gly 
210 215 220 

aca ttt aac tgg ggc aat ggc aaa ttc ccg ctg ctg age caa ccc agt 720 
Thr Phe Asn Trp Gly Asn Gly Lys Phe Pro Leu Leu Ser Gin Pro Ser 
225 230 235 240 

gcg get tat cac ggc ctt gtg cac tgg gat gee ttc ggc ttc ggc age 768 
Ala Ala Tyr His Gly Leu Val His Trp Asp Ala Phe Gly Phe Gly Ser 
245 250 255 

gac gtc tgc aag atg ctg gga gtg ccg gac aac cgc aac gtc gee ttt 816 
Asp Val Cys Lys Met Leu Gly Val Pro Asp Asn Arg Asn Val Ala Phe 
260 265 270 

gee ctg cga gee egg gtc gag ggt eta egg gac tgg ggt ccg gcg gtt 864 
Ala Leu Arg Ala Arg Val Glu Gly Leu Arg Asp Trp Gly Pro Ala Val 
275 280 285 

agt ccc ttc aat age ttc ctg ctg ctg caa ggt eta gaa acc etc age 912 
Ser Pro Phe Asn Ser Phe Leu Leu Leu Gin Gly Leu Glu Thr Leu Ser 
290 295 300 



ctg egg gtg gag cgc cac acg gag aac gec atg gcg ctg gec acc tgg 



960 
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Leu Arg Val Glu Arg His 
305 ~ 3 10 

eta gca acg cac ccc aat 
Leu Ala Thr His Pro Asn 
325 

age gat ccg tat cac gca 
Ser Asp Pro Tyr His Ala 
340 

atg gga tgc atg ctg atg 
Met Gly Cys Met Leu Met 
355 

gtc cgt ttc ate aac age 
Val Arg Phe He Asn Ser 
370 

ggg 9 at 9 CC aaa acc t99 

Gly Asp Ala Lys Thr Trp 
385 390 



Thr Glu Asn 



gtg gag cat 
Val Glu His 



get gee aag 
Ala Ala Lys 
345 

ttc teg etc 
Phe Ser Leu 
360 

ctt caa ctg 
Leu Gin Leu 
375 

tga 



Ala Met Ala 
315 

gtg age tac 
Val Ser Tyr 
330 

aaa tac ctg 
Lys Tyr Leu 



aag ggc ggt 
Lys Gly Gly 



gee agt cac 
Ala Ser His 
380 



Leu Ala Thr Trp 
320 

cca ggc ctg age 
Pro Gly Leu Ser 
335 

acg ggc egg ggc 
Thr Gly Arg Gly 
350 

tac gac gat gca 
Tyr Asp Asp Ala 
365 

etc gee aat gtg 
Leu Ala Asn Val 



1008 



1056 



1104 



1152 



1173 



<210> 


16 


<211> 


390 


<212> 


PRT 


<213> 


Synechococcus sp 



<400> 16 



Met Ser Gin Arg Phe Glu Thr Leu Gin Leu His Ala Gly Gin Ser Pro 



1 



5 10 • 15 



Asp Ser Ala Thr Asn Ala Arg Ala Val Pro He Tyr Gin Thr Ser Ser 



Tyr Val Phe Asn Asp Ala Glu His Gly Ala Asn Leu Phe Gly Leu Lys 
35 40 45 

Glu Phe Gly Asn He Tyr Thr Arg Leu Met Asn Pro Thr Thr Asp Val 
50 55 60 

Phe Glu Lys Arg Val Ala Ala Leu Glu Gly Gly Val Ala Ala Leu Ala 
65 70 75 

Thr Ala Ser Gly Gin Ser Ala Gin Phe Leu Ala He Thr Asn Cys Met 
85 9° 

Gin Ala Gly Asp Asn Phe Val Ser Thr Ser Phe Leu Tyr Gly Gly Thr 
100 105 X1 ° 



WO 2(104/024933 PCT/EP2003/009453 

32/130 

Tyr Asn Gin Phe Lys Val Gin Phe Pro Arg Leu Gly Xle Asp Val Arg 
115 120 ~ 125 

Phe Ala Asp Gly Asp Asp Val Glu Ser Phe Ala Ala Gin lie Asp Asp 
130 135 140 

Lys Thr Lys Gly Leu Tyr Val Glu Ala Met Gly Asn Pro Arg Phe Asn 
145 150 155 160 

lie Pro Asp Phe Glu Gly Leu Ser Ala Leu Ala Lys Glu Arg Gly lie 
165 170 175 

Pro Leu lie Val Asp Asn Thr Leu Gly Ala Cys Gly Ala Leu Met Arg 
180 185 190 

Pro lie Asp His Gly Ala Asp Val Val Val Glu Ser Ala Thr Lys Trp 
195 200 205 

lie Gly Gly His Gly Thr Ser Leu Gly Gly Val lie Val Asp Ala Gly 
210 215 220 

Thr Phe Asn Trp Gly Asn Gly Lys Phe Pro Leu Leu Ser Gin Pro Ser 
225 230 235 240 

Ala Ala Tyr His Gly Leu Val His Trp Asp Ala Phe Gly Phe Gly Ser 
245 250 255 

Asp Val Cys Lys Met Leu Gly Val Pro Asp Asn Arg Asn Val Ala Phe 
260 265 270 

Ala Leu Arg Ala Arg Val Glu Gly Leu Arg Asp Trp Gly Pro Ala Val 
275 280 285 

Ser Pro Phe Asn Ser Phe Leu Leu Leu Gin Gly Leu Glu Thr Leu Ser 
290 295 300 

Leu Arg Val Glu Arg His Thr Glu Asn Ala Met Ala Leu Ala Thr Trp 
305 310 315 320 

Leu Ala Thr His Pro Asn Val Glu His Val Ser Tyr Pro Gly Leu Ser 
325 330 335 

Ser Asp Pro Tyr His Ala Ala Ala Lys Lys Tyr Leu Thr Gly Arg Gly 
340 345 350 



Met Gly Cys Met Leu Met Phe Ser Leu Lys Gly Gly Tyr Asp Asp Ala 
355 360 * 365 



33/130 
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Val Arg Phe lie Asn Ser Leu Gin Leu Ala Ser His Leu Ala Asn Val 
370 375 380 

Gly Asp Ala Lys Thr Trp 
385 390 

<210> 17 

<211> 1314 

<212> DNA 

<213> Emericella nidulans 



<220> 

<221> CDS 

<222> (1)..(1314) 

<223> 



ata tec gac cct tea ccg aaa cgt ttc gag acc etc cag etc cat gcg 48 
Set Ser Asp Pro Ser Pro Lys Arg Phe Glu Thr Leu Gin Leu His Ala 
! 5 10 15 

ggc cag gag cct gac cct gca act aat tec egg get gtc cca ate tat 96 
G !y 111 Glu Pro Asp Pro Ala Thr Asn Ser Arg Ala Val Pro He Tyr 

aea aea acg tec tac acc ttc aat gac tec gca cac ggc gee agg ctt 144 
Ala Thr Thr Ser Tyr Thr Phe Asn Asp Ser Ala His Gly Ala Arg Leu 
35 40 45 

ttt ggc etc aaa gag ttt ggc aat att tac age cga att atg aat ccc 192 
Phe Glv Leu Lys Glu Phe Gly Asn He Tyr Ser Arg He Met Asn Pro 
50 55 60 

aca ate gat gtc ttc gaa aaa cgt att get gca etc gag gga ggt gtc 240 
Thr val Asp Val Phe Glu Lys Arg He Ala Ala Leu Glu Gly Gly Val 
65 70 75 80 

get gcg gtg get gee tea tct ggc cag gca gee cag ttc atg gee ate 288 
Ala All Val Ala Ala Ser Ser Gly Gin Ala Ala Gin Phe Met Ala He 
85 90 95 

tct act eta gee cat get ggt gac aat ate gtt tec aca agt aat ttg 336 
Ser Ala Leu Ala His Ala Gly Asp Asn He Val Ser Thr Ser Asn Leu 
100 105 110 

t-at aat ggt aca tac aat cag ttt aag gtc ctt ttc cca cga ctg gga 384 
Tvr Gly Gly Thr Tyr Asn Gin Phe Lys Val Leu Phe Pro Arg Leu Gly 
y us 120 125 
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att acc aca aaa ttc gtg cag gga gac aaa gca gag gac att gcc gcc 432 
He Thr Thr Lys Phe Val Gin Gly Asp Lys Ala Glu Asp He Ala Ala 
130 135 140 

get ate gat gac cgt acc aag gcc gtc tac gtc gag aca ata gga aac 480 
Ala He Asp Asp Arg Thr Lys Ala Val Tyr Val Glu Thr He Gly Asn 
"5 150 155 160 

cct cgc tac aat gtg ccc gac ttt gag gtc att gca aaa gta gcc cat 528 
Pro Arg Tyr Asn Val Pro Asp Phe Glu Val He Ala Lys Val Ala His 
165 170 175 

gag aag gga att ccc ctt gtg gtt gac aac acc ttc ggt gcc gga ggc 576 
Glu Lys Gly He Pro Leu Val Val Asp Asn Thr Phe Gly Ala Gly Gly 
180 185 190 

tac ttt gtt cga ccc att gaa cat ggc gcc gac att gtc gtg cac agt 624 
Tyr Phe Val Arg Pro He Glu His Gly Ala Asp He Val Val His Ser 
195 200 205 

gca act aaa tgg att gga ggt cat ggc aca acc ate gga ggc gtt gtc 672 
Ala Thr Lys Trp He Gly Gly His Gly Thr Thr He Gly Gly Val Val 
210 215 220 

gtg gac age ggc aaa ttc gac tgg ggc aag aac gcc gcg egg ttt cct 720 
Val Asp Ser Gly Lys Phe Asp Trp Gly Lys Asn Ala Ala Arg Phe Pro 
225 230 235 ~ 240 

cag ttc acg cag cct tct gaa ggt tac cac ggg ttg aac ttc tgg gag 768 
Gin Phe Thr Gin Pro Ser Glu Gly Tyr His Gly Leu Asn Phe Trp Glu 
245 250 255 



acc ttc ggc ccc att gcc ttc gcg att cgt gtc egg gtc gaa ate ctg 
Thr Phe Gly Pro He Ala Phe Ala He Arg Val Arg Val Glu He Leu 
260 265 270 



816 



cgc gac etc ggg tec gcg ctg aac cct ttc gcc gcg cag cag etc ate 864 
Arg Asp Leu Gly Ser Ala Leu Asn Pro Phe Ala Ala Gin Gin Leu He 
275 280 285 

ctg ggt ctg gaa acc eta age ttg cgc get gag cgt cat get tec aac 912 
Leu Gly Leu Glu Thr Leu Ser Leu Arg Ala Glu Arg His Ala Ser Asn 
290 295 300 



960 



get ctg gcc etc gcc aac tgg eta aag aag aat gat cac gtc age tgg 
Ala Leu Ala Leu Ala Asn Trp Leu Lys Lys Asn Asp His Val Ser Trp 
305 310 315 320 

gtt tct tac gtg ggc eta gaa gag cac tec age cac gaa gtt gca aag 1008 
Val Ser Tyr Val Gly Leu Glu Glu His Ser Ser His Glu Val Ala Lys 
325 330 335 

aag tac etc aag cgt ggg ttc ggc ggt gtc eta tec ttt ggt gtc aag 1056 
Lys Tyr Leu Lys Arg Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys 
340 345 350 

ggt gag gca gcc gtc ggt age cag gtt gtc gac aac ttt aag etc ate 1104 
Gly Glu Ala Ala Val Gly Ser Gin Val Val Asp Asn Phe Lys Leu He 
355 360 365 

tec aat eta gca aat gtt gga gac tec aag acc etc gcg att cac ccc 1152 
Ser Asn Leu Ala Asn Val Gly Asp Ser Lys Thr Leu Ala He His Pro 
370 375 380 
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tag age acc act cac gag cag ttg acc gac cag gag cga ate gat tct 

Trp Ser Thr Thr His Glu Gin Leu Thr Asp Gin Glu Arg lie Asp Ser 

385 390 395 400 

gat gtt acg gaa gat gee ate cgc ate tct gtc ggc act gag cac ate 

Gly Val Thr Glu Asp Ala He Arg He Ser Val Gly Thr Glu His He 
405 410 415 

qac gac ate ate gec gac ttt gaa cag tea ttt gca gcg acc ttc aaa 

Asp Asp He He Ala Asp Phe Glu Gin Ser Phe Ala Ala Thr Phe Lys 
420 425 430 

gtt gtc egg agt get tag 
Val Val Arg Ser Ala 
435 



<210> 18 

<211> 437 

<212> PRT 

<213> Emericella nidulans 



1200 



1248 



1296 



1314 



<400> 18 

Met Ser Asp Pro Ser Pro Lys Arg Phe Glu Thr Leu Gin Leu His Ala 
X 5 10 15 

Gly Gin Glu Pro Asp Pro Ala Thr Asn Ser Arg Ala Val Pro He Tyr 
20 , 25 30 

Ala Thr Thr Ser Tyr Thr Phe Asn Asp Ser Ala His Gly Ala Arg Leu 
35 40 45 

Phe Gly Leu Lys Glu Phe Gly Asn He Tyr Ser Arg He Met Asn Pro 
50 * 55 60 

Thr Val Asp Val Phe Glu Lys Arg He Ala Ala Leu Glu Gly Gly Val 
65 * 70 75 80 

Ala Ala Val Ala Ala Ser Ser Gly Gin Ala Ala Gin Phe Met Ala He 
85 90 95 

Ser Ala Leu Ala His Ala Gly Asp Asn He Val Ser Thr Ser Asn Leu 
100 105 HO 

Tyr Gly Gly Thr Tyr Asn Gin Phe Lys Val Leu Phe Pro Arg Leu Gly 
115 120 125 



lie Thr Thr Lys Phe Val Gin Gly Asp Lys Ala Glu Asp He Ala Ala 
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130 135 140 

Ala He Asp Asp Arg Thr Lys Ala Val Tyr Val Glu Thr He Gly Asn 
145 150 155 160 

Pro Arg Tyr Asn Val Pro Asp Phe Glu Val He Ala Lys Val Ala His 
165 170 175 

Glu Lys Gly He Pro Leu Val Val Asp Asn Thr Phe Gly Ala Gly Gly 
180 185 190 

Tyr Phe Val Arg Pro He Glu His Gly Ala Asp He Val Val His Ser 
195 200 205 

Ala Thr Lys Trp He Gly Gly His Gly Thr Thr He Gly Gly Val Val 
210 215 220 

Val Asp Ser Gly Lys Phe Asp Trp Gly Lys Asn Ala Ala Arg Phe Pro 
225 230 235 240 

Gin Phe Thr Gin Pro Ser Glu Gly Tyr His Gly Leu Asn Phe Trp Glu 
245 250 255 

Thr Phe Gly Pro He Ala Phe Ala He Arg Val Arg Val Glu He Leu 
260 265 270 

Arg Asp Leu Gly Ser Ala Leu Asn Pro Phe Ala Ala Gin Gin Leu He 
275 280 285 

Leu Gly Leu Glu Thr Leu Ser Leu Arg Ala Glu Arg His Ala Ser Asn 
290 295 300 

Ala Leu Ala Leu Ala Asn Trp Leu Lys Lys Asn Asp His Val Ser Trp 
305 310 315 320 

Val Ser Tyr Val Gly Leu Glu Glu His Ser Ser His Glu Val Ala Lys 
325 330 335 

Lys Tyr Leu Lys Arg Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys 
340 345 350 

Gly Glu Ala Ala Val Gly Ser Gin Val Val Asp Asn Phe Lys Leu He 
355 360 365 



Ser Asn Leu Ala Asn Val Gly Asp Ser Lys Thr Leu Ala He His Pro 
370 375 380 
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Trp Ser Thr Thr His Glu Gin Leu Thr Asp Gin Glu Arg He Asp Ser 
385 390 395 



Glv val Thr Glu Asp Ala He Arg He Ser Val Gly Thr Glu His He 
7 405 410 415 

Asp Asp He He Ala Asp Phe Glu Gin Ser Phe Ala Ala Thr Phe Lys 
420 425 430 



Val Val Arg Ser Ala 
435 



<210> 19 • 

<211> 1287 

<212> DNA 

<213> Bacteroides fragilis 
<220> 

<221> CDS 

<222> (1) ■ • (1287) 

<223> 



aJa^aa'acg aaa aaa tta cat ttt gag act tta caa etc cat gtt gga 
^ Mer ££ tS Lys Lys Leu His Phe Glu Thr Leu Gin Leu His Val Gly 



aaa act ccc gac ccg gca acc gat gcg cgt gec gta cct att tat 96 
III III Tnr Pro Asp Pro La Thr Asp Ala Arg Ala Val Pro He Tyr 
20 25 30 

cag aca act tec tat gtg ttc egg gat teg gec cat gec gee gca cga 144 
III Thr Thr Ser Tyr Val Phe Arg Asp Ser Ala Hxs Ala Ala Ala Arg 
35 40 45 

ttt gga ttg caa gac cct ggg aat att tat gga cga ctg acc aat tec 
Phe Gly Leu Gin Asp Pro Gly Asn He Tyr Gly Arg Leu Thr Asn Ser 
50 55 60 

a . t caa q ga gta ttg gag gaa cgc ate gca gca ctt gaa ggg gga gta 
Tnr III SJ Val Leu Glu Slu Arg He Ala Ala Leu Glu Gly Gly Val 
65 70 75 

ggt ggg ctt gec gtg get tec gga get get gec gtg acc tat get ate 
Gly Gly Leu Ala Val Ala Ser Gly Ala Ala Ala Val Thr Tyr Ala He 
8S 90 95 

gag aat ate acc cgt tec ggt gat cat att gtg get gec aag acc att 3 36 



192 



240 



288 
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Glu Asn lie Thr Arg Ser Gly Asp His He Val Ala Ala Lys Thr He 
100 105 110 

tat ggg ggc aca tat aac ttg ctg gcg cat act ctg cct get tat gga 384 
Tyr Gly Gly Thr Tyr Asn Leu Leu Ala His Thr Leu Pro Ala Tyr Gly 
115 120 125 

gta acg acc act ttt gta gat ccg tec gat ctt ttt aat ttc gaa egg 432 
Val Thr Thr Thr Phe Val Asp Pro Ser Asp Leu Phe Asn Phe Glu Arg 
130 135 140 

gcg att cgt gaa aat aca aag gcg ata ttc att gaa act ctg gga aac 480 
Ala He Arg Glu Asn Thr Lys Ala He Phe He Glu Thr Leu Gly Asn 
145 150 155 " 160 

ccc aat tec aat att ate gat atg gat gee gta get gee att gee cat 528 
Pro Asn Ser Asn He He Asp Met Asp Ala Val Ala Ala He Ala His 
165 170 175 

aaa tat egg att ccg ctg att gtg gat aat act ttc ggt acg cct tac 576 
Lys Tyr Arg He Pro Leu He Val Asp Asn Thr Phe Gly Thr Pro Tyr 
180 185 190 

ctt ate cgt ccc att gag cac ggg gca gac att gtg gta cat tct gee 624 
Leu He Arg Pro He Glu His Gly Ala Asp He Val Val His Ser Ala 
195 200 205 

aca aaa ttc att ggc gga cac ggc agt teg ttg gga gga gtt att gtc 672 
Thr Lys Phe He Gly Gly His Gly Ser Ser Leu Gly Gly Val He Val 
210 215 220 

gat tec ggt aaa ttt gac tgg gtt get tec ggt aaa ttc ccg caa ctg 720 
Asp Ser Gly Lys Phe Asp Trp Val Ala Ser Gly Lys Phe Pro Gin Leu 
225 230 235 240 

acc gag ccg gat gca agt tat cat ggg gta egg ttt gtc gat get gee 768 
Thr Glu Pro Asp Ala Ser Tyr His Gly Val Arg Phe Val Asp Ala Ala 
245 250 255 

ggg get get gec tac att gtc cgt ata cgt gee gtg ttg ctg cgc gat 816 
Gly Ala Ala Ala Tyr He Val Arg He Arg Ala Val Leu Leu Arg Asp 
260 265 270 

acg ggt get gee ate .age ccg ttc aat get ttt ate ttg ctg caa ggg 864 
Thr Gly Ala Ala He Ser Pro Phe Asn Ala Phe He Leu Leu Gin Gly 
275 280 285 

ttg gag act ttg tct ttg cgt gta gaa egg cat gtg gee aat get ttg 912 
Leu Glu Thr Leu Ser Leu Arg Val Glu Arg His Val Ala Asn Ala Leu 
290 295 300 

aag gtt att gat ttt ctg gtg aac cat ccg aag gta gcg get gtt aat 960 
Lys Val He Asp Phe Leu Val Asn His Pro Lys Val Ala Ala Val Asn 
305 310 315 320 

cat cca tea ttg ccc ggt cat ccg gat cat gee ate tat caa cgt tat 1008 
His Pro Ser Leu Pro Gly His Pro Asp His Ala He Tyr Gin Arg Tyr 
325 ^ 330 335 



ttt cct ggc ggg gca ggt tct ate ttc act ttc gag gta aag gga gga 1056 
Phe Pro Gly Gly Ala Gly Ser He Phe Thr Phe Glu Val Lys Gly Gly 
340 345 350 
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3 S E S H 17. S a S £ 2 S S a = 2 

355 360 

2 E =5 « K a S 2 s a a a a a 5 a 

■37c 3oU 
370 3/5 

t-~, caa tta aat gcg cag gag ctg gag gaa cag ggg att 

s a a sZ S 25 a «2 i- « G1 » 01 » «» Gly JS 

385 390 395 

a a si? 3 s a 2 a a a a is a a s a 
a a a a a a a a a a a a " a 

420 425 



<210> 20 
<211> 428 



1104 



1152 



1200 



1248 



1287 



<212> PRT 

<213> Bacteroides fragilis 



<400> 20 

Met Glu Thr Lys W His Phe Glu Thr Leu Gin Leu His Val Gly 



Gin Glu Thr Pro Asp Pro Ala Thr Asp Ala Arg Ala Val Pro He Tyr 



20 



Gin Thr Thr Ser Tyr Val Phe Arg Asp Ser Ala His Ala Ala Ala Arg 
35 40 

Phe Gly Leu Gin Asp Pro Gly Asn He Tyr Gly Arg uu Thr Asn Ser 
50 55 

Thr Gin Gly val Leu Glu Glu Arg He Ala Ala Leu Glu Gly Gly Val 
65 70 

Gly Gly Leu Ala Val Ala Ser Gly Ala Ala Ala Val Thr Tyr Ala He 
85 90 

Glu Asn He Thr Arg Ser Gly Asp His He Val Ala Ala Lys Thr He 
100 105 

Tyr Gly Gly Thr Tyr Asn Leu Leu Ala His Thr Leu Pro Ala Tyr Gly 
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Val Thr Thr Thr Phe Val Asp Pro Ser Asp Leu Phe Asn Phe Glu Arg 
130 135 140 

Ala lie Arg Glu Asn Thr Lys Ala lie Phe lie Glu Thr Leu Gly Asn 
14S 150 1S5 160 

Pro Asn Ser Asn He He Asp Met Asp Ala Val Ala Ala He Ala His 
165 170 175 

Lys Tyr Arg lie Pro Leu He Val Asp Asn Thr Phe Gly Thr Pro Tyr 
180 185 190 

Leu lie Arg Pro lie Glu His Gly Ala Asp He Val Val His Ser Ala 
195 200 205 

Thr Lys Phe lie Gly Gly His Gly Ser Ser Leu Gly Gly Val He Val 
210 215 220 

Asp Ser Gly Lys Phe Asp Trp Val Ala Ser Gly Lys Phe Pro Gin Leu 
225 230 235 240 

Thr Glu Pro Asp Ala Ser Tyr His Gly Val Arg Phe Val Asp Ala Ala 
245 250 255 

Gly Ala Ala Ala Tyr lie Val Arg He Arg Ala Val Leu Leu Arg Asp 
260 265 270 

Thr Gly Ala Ala He Ser Pro Phe Asn Ala Phe He Leu Leu Gin Gly 
275 280 28S 

Leu Glu Thr Leu Ser Leu Arg Val Glu Arg His Val Ala Asn Ala Leu 
290 295 300 

Lys Val lie Asp Phe Leu Val Asn His Pro Lys Val Ala Ala Val Asn 
305 3X0 315 320 

His Pro Ser Leu Pro Gly His Pro Asp His Ala He Tyr Gin Arg Tyr 
325 330 " 335 

Phe Pro Gly Gly Ala Gly Ser He Phe Thr Phe Glu Val Lys Gly Gly 
340 345 350 

Thr Glu Glu Ala Gin Lys Phe He Asp Ser Leu Gin lie Phe Ser Leu 
355 360 365 



Leu Ala Asn Val Ala Asp Val Lys Ser Leu Val He His Pro Gly Thr 



WO 2004/024933 ^ ^CT/EP2003/009453 

41/130 



370 375 380 



Thr Thr His Ser Gin Leu Asn Ala Gin Glu Leu Glu Glu Gin Gly He 
385 390 395 400 



Lys Pro Gly Thr Val Arg Leu Ser He Gly Thr Glu His He Glu Asp 
405 410 415 



lie He Asp Asp Leu Arg Gin Ala Leu Glu Lys He 
420 425 



<210> 21 

<211> 1278 

<212> DNA 

<213> Pseudomonas aeruginosa 



<220> 

<221> CDS 

<222> (1) - . (1278) 

<223> 



<400> 21 

atg aaa ctg gaa acc ctg gcc gtc cac gcc ggc tac age cct gac ccg 48 
Met Lys Leu Glu Thr Leu Ala Val His Ala Gly Tyr Ser Pro Asp Pro 
15 10 15 

acc acc cgc gcg gtg gcg gtg ccg ate tac cag acc acc tec tac gcc 96 
Thr Thr Arg Ala Val Ala Val Pro He Tyr Gin Thr Thr Ser Tyr Ala 
20 25 30 

ttc gac gac acc cag cat ggc gcc gac ctg ttc gac ctg aag gta ccg 144 
Phe Asp Asp Thr Gin His Gly Ala Asp Leu Phe Asp Leu Lys Val Pro 
35 40 45 

ggc aac ate tac aca egg ate atg aac ccc acc aac gac gta ctg gaa 192 
Gly Asn He Tyr Thr Arg He Met Asn Pro Thr Asn Asp Val Leu Glu 
50 55 60 

cag cgc gtc gcg gcg ctg gaa ggc ggg gtc ggg gcg ctg gcg gtg gcc 240 
Gin Arg Val Ala Ala Leu Glu Gly Gly Val Gly Ala Leu Ala Val Ala 
65 ~ 70 75 80 



teg ggg atg gcg gcc ate acc tac gcg ate cag acc gtc gcc gag gcc 
Ser Gly Met Ala Ala He Thr Tyr Ala He Gin Thr Val Ala Glu Ala 
85 90 95 



288 



ggc gac aac ate gtc teg gtg gcc aag etc tac ggc ggc acc tac aac 336 
Gly Asp Asn He Val Ser Val Ala Lys Leu Tyr Gly Gly Thr Tyr Asn 
100 105 HO 
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ctg ctg gcc cac acc ctg cca cgc ate ggc ate cag gcg cgc ttc gec 3 84 

Leu Leu Ala His Thr Leu Pro Arg lie Gly lie Gin Ala Arg Phe Ala 
115 120 125 

gcc cac gac gac gtc gcc gcc ctg gaa gcg ctg ate gac gag egg acc 432 
Ala His Asp Asp Val Ala Ala Leu Glu Ala Leu lie Asp Glu Arg Thr 
130 135 140 

aag gcc gtg ttc tgc gaa acc ate ggc aac ecg gcg ggc aac ate ate 480 
Lys Ala Val Phe Cys Glu Thr lie Gly Asn Pro Ala Gly Asn lie lie 
145 150 155 160 

gac ctg cag gca ctg gcc gac gcc get cac cgc cac ggc gtg cca ctg 528 
Asp Leu Gin Ala Leu Ala Asp Ala Ala His Arg His Gly Val Pro Leu 
165 170 175 

ate gtc gac aac acg gta gcc acc ccg gtg etc tgc egg ccg ttc gag 576 
lie Val Asp Asn Thr Val Ala Thr Pro Val Leu Cys Arg Pro Phe Glu 
180 185 190 

cac ggc gcc gac ate gtc gtg cac teg ctg acc aag tac atg ggc ggc 624 
His Gly Ala Asp lie Val Val His Ser Leu Thr Lys Tyr Met Gly Gly 
195 200 205 

cac ggc acc age ate ggc ggg ate gtg gtc gac tec ggc aaa ttc gac 672 
His Gly Thr Ser lie Gly Gly lie Val Val Asp Ser Gly Lys Phe Asp 
210 215 220 

tgg gcg gcg aac aag teg cgc ttc ccg ctg ctg aac acg ccc gat ccg 720 
Trp Ala Ala Asn Lys Ser Arg Phe Pro Leu Leu Asn Thr Pro Asp Pro 
225 230 235 240 

tec tac cac ggc gtc acc tac acc gag gcc ttc gga ccc gcc gcc ttc 768 
Ser Tyr His Gly Val Thr Tyr Thr Glu Ala Phe Gly Pro Ala Ala Phe 
245 250 255 

ate ggc cgc tgc egg gtg gta ccg ctg cgc aac atg ggc gcg gcg etc 816 
lie Gly Arg Cys Arg Val Val Pro Leu Arg Asn Met Gly Ala Ala Leu 
260 265 270 

teg ccg ttc aac gcc ttc etc ate etc caa ggc ctg gag acc ctg gcg 864 
Ser Pro Phe Asn Ala Phe Leu lie Leu Gin Gly Leu Glu Thr Leu Ala 
275 280 285 

ctg cgc atg gag cgc cac tgc gac aac gcc etc gcc gtg gcc cgc tac 912 
Leu Arg Met Glu Arg His Cys Asp Asn Ala Leu Ala Val Ala Arg Tyr 
290 295 300 

ctg cag cag cat ccg cag gtg gcc tgg gtg aaa tac gcc ggc etc gcc 960 
Leu Gin Gin His Pro Gin Val Ala Trp Val Lys Tyr Ala Gly Leu Ala 
305 310 315 320 



gac aac ccc gag cac gcc ctg gcc egg 
Asp Asn Pro Glu His Ala Leu Ala Arg 
325 

gcg gcg ate ctg tct ttc ggc ate cag 
Ala Ala He Leu Ser Phe Gly Il e Gin 
340 345 

cgc ttc ate gac gcc ttg aag ctg gtg 
Arg Phe lie Asp Ala Leu Lys Leu Val 



cgc tac ctg ggg ggc cgc ccg 1008 
Arg Tyr Leu Gly Gly Arg Pro 
330 335 

ggc ggc age gcc gcc ggc gcg 1056 
Gly Gly Ser Ala Ala Gly Ala 
350 

gtg egg ctg gtc aac ate ggc 1104 
Val Arg Leu Val Asn Ile Gly 
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355 360 365 

gac gcc aag tec ctg gcc tgc cac ccg gcg age acc acc cac cgc cag 
Asp Ala Lys Ser Leu Ala Cys His Pro Ala Ser Thr Thr His Arg Gin 
370 375 380 

ttg aac gcg gag gaa ctg gcc cgc gcc gga gtc tec gac gac atg gtg 
Leu Asn Ala Glu Glu Leu Ala Arg Ala Gly Val Ser Asp Asp Met Val 
385 390 395 400 

egg ctg teg ate ggc ate gag cac ate gac gac ate etc gcc gac etc 
Arg Leu Ser lie Gly lie Glu His He Asp Asp lie Leu Ala Asp Leu 
4 05 410 415 

gac cag gcc ctg gcc gcc gcc gca cgc tga 
Asp Gin Ala Leu Ala Ala Ala Ala Arg 
420 425 



<210> 22 

<211> 425 

<212> PRT 

<213> Pseudoraonas aeruginosa 

<400> 22 

Met Lys Leu Glu Thr Leu Ala Val His Ala Gly Tyr Ser Pro Asp Pro 
1 5 10 15 

Thr Thr Arg Ala Val Ala Val Pro He Tyr Gin Thr Thr Ser Tyr Ala 
20 25 30 

Phe Asp Asp Thr Gin His Gly Ala Asp Leu Phe Asp Leu Lys Val Pro 
35 40 45 

Gly Asn lie Tyr Thr Arg He Met Asn Pro Thr Asn Asp Val Leu Glu 
50 55 60 

Gin Arg Val Ala Ala Leu Glu Gly Gly Val Gly Ala Leu Ala Val Ala 
65 ~ 70 75 80 

Ser Gly Met Ala Ala He Thr Tyr Ala He Gin Thr Val Ala Glu Ala 
85 90 95 

Gly Asp Asn He Val Ser Val Ala Lys Leu Tyr Gly Gly Thr Tyr Asn 
100 105 11° 



1152 



1200 



1248 



1278 



Leu Leu Ala His Thr Leu Pro Arg He Gly He Gin Ala Arg Phe Ala 
115 120 125 
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Ala His Asp Asp Val Ala Ala Leu Glu Ala Leu lie Asp Glu Arg Thr 
130 135 140 

Lys Ala Val Phe Cys Glu Thr lie Gly Asn Pro Ala Gly Asn lie He 
145 150 155 160 

Asp Leu Gin Ala Leu Ala Asp Ala Ala His Arg His Gly Val Pro Leu 
165 170 " 175 

He Val Asp Asn Thr Val Ala Thr Pro Val Leu Cys Arg Pro Phe Glu 
180 185 190 

His Gly Ala Asp He Val Val His Ser Leu Thr Lys Tyr Met Gly Gly 
195 200 205 

His Gly Thr Ser lie Gly Gly He Val Val Asp Ser Gly Lys Phe Asp 
210 215 220 

Trp Ala Ala Asn Lys Ser Arg Phe Pro Leu Leu Asn Thr Pro Asp Pro 
225 230 235 240 

Ser Tyr His Gly Val Thr Tyr Thr Glu Ala Phe Gly Pro Ala Ala Phe 
245 250 255 

He Gly Arg Cys Arg Val Val Pro Leu Arg Asn Met Gly Ala Ala Leu 
260 265 270 

Ser Pro Phe Asn Ala Phe Leu He Leu Gin Gly Leu Glu Thr Leu Ala 
275 280 285 

Leu Arg Met Glu Arg His Cys Asp Asn Ala Leu Ala Val Ala Arg Tyr 
290 295 300 

Leu Gin Gin His Pro Gin Val Ala Trp Val Lys Tyr Ala Gly Leu Ala 
305 310 315 320 

Asp Asn Pro Glu His Ala Leu Ala Arg Arg Tyr Leu Gly Gly Arg Pro 
325 330 335 

Ala Ala He Leu Ser Phe Gly He Gin Gly Gly Ser Ala Ala Gly Ala 
340 345 350 

Arg Phe He Asp Ala Leu Lys Leu Val Val Arg Leu Val Asn He Gly 
355 360 365 



Asp Ala Lys Ser Leu Ala Cys His Pro Ala Ser Thr Thr His Arg Gin 
370 375 380 
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Leu Asn Ala Glu Glu Leu Ala Arg Ala Gly Val Ser Asp Asp Met Val 
385 390 395 400 

Ara Leu Ser lie Gly He Glu His He Asp Asp He Leu Ala Asp Leu 
* 405 410 415 



Asp Gin Ala Leu Ala Ala Ala Ala Arg 
420 425 



<210> 23 
<211> 1296 
<212> DNA 

<213> Bordetella bronchiseptica 
<220> 

<221> CDS 

<222> (1) . . (1296) 

<223> 

atg 0 igc 2 gaa ccg aac caa ccc ate tgg egg ctg gag acc ate gee gta 48 
Met Ser Glu Pro Asn Gin Pro He Trp Arg Leu Glu Thr He Ala Val 



1 5 



10 15 



cat ggg ggc tac egg ccc gac ccg acc acg cgc gcg gtg gcg gtg ccg 96 
His Gly Gly Tyr Arg Pro Asp Pro Thr Thr Arg Ala Val Ala Val Pro 
20 25 30 

ate tac cag acc gtg gec tat gcg ttc gac gac acc cag cat ggc gcg 
lie Tyr Gin Thr Val Ala Tyr Ala Phe Asp Asp Thr Gin His Gly Ala 
35 40 45 



gac ctg ttc gac ctg aag gtg ccg ggc aat ate tac acc cgc ate atg 192 
Isp Leu Phe Asp Leu Lys Val Pro Gly Asn He Tyr Thr Arg He Met 
^ 50 55 60 



aac ccc acc acc gac gtg ctg gag cag cgc gtg gcg gcg ctg gaa tgc 

Asn Pro Thr Thr Asp Val Leu Glu Gin Arg Val Ala Ala Leu Glu Cys 
65 70 75 80 

ggc gtg gec gcg ctg gcg ctg gec tec ggc cag gcg gcg gtg acc tat 

Glv Val Ala Ala Leu Ala Leu Ala Ser Gly Gin Ala Ala Val Thr Tyr 
85 90 95 

gcg ate ctg acc ate gee gag gcg ggc gac aac ate gtg teg tec age 

Ala He Leu Thr He Ala Glu Ala Gly Asp Asn He Val Ser Ser Ser 
100 105 HO 



144 



acg 



ctg tat ggc ggc acg tac aac ctg ttc gec cac acg ctg ccg cag 



240 



288 



336 



384 
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Thr Leu Tyr Gly Gly Thr Tyr Asn Leu Phe Ala His Thr Leu Pro Gin 
115 120 125 

tac ggc ate acg acc cgc ttc gec gat ccg cgc aac ctg get teg ttc 432 
Tyr Gly He Thr Thr Arg Phe Ala Asp Pro Arg Asn Leu Ala Ser Phe 
130 135 140 

gag gcg ctg ate gac gag cgc acc aag gee att ttc gec gag teg gtg 480 
Glu Ala Leu He Asp Glu Arg Thr Lys Ala lie Phe Ala Glu Ser Val 
145 150 155 160 

ggc aat ccg ctg ggc aac gtc acc gac ate gec gcg ctg gee gag ate 528 
Gly Asn Pro Leu Gly Asn Val Thr Asp He Ala Ala Leu Ala Glu lie 
165 170 175 

gcg cac cgc cat ggc gtg ccg ctg ate gtc gac aac acg gtg ccg teg 576 
Ala His Arg His Gly Val Pro Leu He Val Asp Asn Thr Val Pro Ser 
180 185 190 

ccc tac ctg ctg cgc ccc ate gag cac ggc gee gac ate gtg gtg cag 624 
Pro Tyr Leu Leu Arg Pro He Glu His Gly Ala Asp He Val Val Gin 
195 200 205 

teg etc acc aag tac ctg ggc ggg cac ggc acc age ctg ggc ggg gee 672 
Ser Leu Thr Lys Tyr Leu Gly Gly His Gly Thr Ser Leu Gly Gly Ala 
210 215 220 

ate ate gat teg ggc aag ttt ccc tgg gee gag cac aag gcg cgc ttc 720 
He He Asp Ser Gly Lys Phe Pro Trp Ala Glu His Lys Ala Arg Phe 
225 230 235 240 

aag cgc ctg aac gag ccc gac gtg age tac cac ggc gtg gtc tac acc 768 
Lys Arg Leu Asn Glu Pro Asp Val Ser Tyr His Gly Val Val Tyr Thr 
245 250 255 

gag gcg ttc ggc gcg gcg gee tat ate ggc cgc gee cgc gtg gtg ccg 816 
Glu Ala Phe Gly Ala Ala Ala Tyr He Gly Arg Ala Arg Val Val Pro 
260 265 270 

ctg cgc aat acc ggc gcg gee att teg ccg ttc aac gee ttc cag ate 864 
Leu Arg Asn Thr Gly Ala Ala He Ser Pro Phe Asn Ala Phe Gin He 
275 280 285 

ctg cag ggc ate gag acg ctg gcg ctg cgc gtg gac cgc ate gtc gag 912 
Leu Gin Gly He Glu Thr Leu Ala Leu Arg Val Asp Arg He Val Glu 
290 295 300 

aac teg gtc aag gtg gec ggg ttc ctg cgc gac cat ccc aag gtc gaa 960 
Asn Ser Val Lys Val Ala Gly Phe Leu Arg Asp His Pro Lys Val Glu 
305 310 315 320 

tgg gtc aac tat gee ggc ctg ccc gac cat gec gac cat gcg ctg gtg 1008 
Trp Val Asn Tyr Ala Gly Leu Pro Asp His Ala Asp His Ala Leu Val 
325 330 335 

cgc aag tac atg ggc ggc aag gee ccc ggc ctg ttc act ttc ggc gtg 1056 
Arg Lys Tyr Met Gly Gly Lys Ala Pro Gly Leu Phe Thr Phe Gly Val 
340 345 350 



aag ggc ggc cgc gag gee ggc gcg cgc ttc cag gac gee ttg cag ctg 1104 
Lys Gly Gly Arg Glu Ala Gly Ala Arg Phe Gin Asp Ala Leu Gin Leu 
355 360 365 
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ttc acc cgc ctg gtg aac ate ggc gac gec aag teg ctg gee acg cac 1152 
Phe Thr Arg Leu Val Asn lie Gly Asp Ala Lys Ser Ijeu Ala Thr His 
370 375 380 

ccg get tec acc acg cac cgc cag etc aac ccc gaa gag etc gaa aag 1200 
Pro Ala Ser Thr Thr His Arg Gin Leu Asn Pro Glu Glu Leu Glu Lys 
385 390 395 400 

gec ggc gtg cgc gag gaa acg gtg cgc ctg teg ate ggg ate gag cat 1248 
Ala Gly Val Arg Glu Glu Thr Val Arg Leu Ser lie Gly lie Glu His 
405 410 415 

ate gac gac ctg ate gee gac ctg gaa cag gcg ctg gcg caa gtc tga 12 96 

lie Asp Asp Leu He Ala Asp Leu Glu Gin Ala Leu Ala Gin Val 
420 425 430 

<210> 24 
_ <211> 431 
<212> PRT 

<213> Bordetella bronchi septica 



<400> 24 

Met Ser Glu Pro Asn Gin Pro He Trp Arg Leu Glu Thr He Ala Val 
1 5 10 15 

His Gly Gly Tyr Arg Pro Asp Pro Thr Thr Arg Ala Val Ala Val Pro 
20 25 30 



He Tyr Gin Thr Val Ala Tyr Ala Phe Asp Asp Thr Gin His Gly Ala 
35 40 45 

Asp Leu Phe Asp Leu Lys Val Pro Gly Asn He Tyr Thr Arg He Met 

50 55 60 



Asn Pro Thr Thr Asp Val Leu Glu Gin Arg Val Ala Ala Leu Glu Cys 
65 70 75 80 

Gly Val Ala Ala Leu Ala Leu Ala Ser Gly Gin Ala Ala Val Thr Tyr 
85 90 95 



Ala He Leu Thr He Ala Glu Ala Gly Asp Asn He Val Ser Ser Ser 
100 105 110 



Thr Leu Tyr Gly Gly Thr Tyr Asn Leu Phe Ala His Thr Leu Pro Gin 
115 120 125 



Tyr Gly He Thr Thr Arg Phe Ala Asp Pro Arg Asn Leu Ala Ser Phe 
130 135 140 
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Glu Ala Leu lie Asp Glu Arg Thr Lys Ala lie Phe Ala Glu Ser Val 
145 150 155 160 



Gly Asn Pro lieu Gly Asn Val Thr Asp lie Ala Ala Leu Ala Glu lie 
165 170 175 



Ala His Arg His Gly Val Pro Leu He Val Asp Asn Thr Val Pro Ser 
180 185 190 



Pro Tyr Leu Leu Arg Pro He Glu His Gly Ala Asp lie Val Val Gin 
195 200 205 



Ser Leu Thr Lys Tyr Leu Gly Gly His Gly Thr Ser Leu Gly Gly Ala 
210 215 220 



He lie Asp Ser Gly Lys Phe Pro Trp Ala Glu His Lys Ala Arg Phe 
225 230 235 240 



Lys Arg Leu Asn Glu Pro Asp Val Ser Tyr His Gly Val Val Tyr Thr 
245 250 255 



Glu Ala Phe Gly Ala Ala Ala Tyr lie Gly Arg Ala Arg Val Val Pro 
260 265 270 



Leu Arg Asn Thr Gly Ala Ala lie Ser Pro Phe Asn Ala Phe Gin He 
275 280 285 



Leu Gin Gly He Glu Thr Leu Ala Leu Arg Val Asp Arg He Val Glu 

290 295 300 

Asn Ser Val Lys Val Ala Gly Phe Leu Arg Asp His Pro Lys Val Glu 

305 • -310 315 320 



Trp Val Asn Tyr Ala Gly Leu Pro Asp His Ala Asp His Ala Leu Val 
325 330 335 



Arg Lys Tyr Met Gly Gly Lys Ala Pro Gly Leu Phe Thr Phe Gly Val 
340 345 350 



Lys Gly Gly Arg Glu Ala Gly Ala Arg Phe Gin Asp Ala Leu Gin Leu 
355 360 365 



Phe Thr Arg Leu Val Asn He Gly Asp Ala Lys Ser Leu Ala Thr His 
370 375 380 



Pro Ala Ser Thr Thr His Arg Gin Leu Asn Pro Glu Glu Leu Glu Lys 
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385 390 395 400 

Ala Gly Val Arg Glu Glu Thr Val Arg Leu Ser lie Gly He Glu His 
405 410 415 

He Asp Asp Leu He Ala Asp Leu Glu Gin Ala Leu Ala Gin Val 
420 425 430 

<210> 25 
<211> 1269 
<212> DNA v 
<213> Nitrosomonas europaea 



<220> 

<221> CDS 

<222> (1) . . (1269) 

<223> 



<400> 25 

atg aaa egg gaa aca etc gec att cat ggc ggt ttt gec ggc gat ccg 46 

Met Lys Arg Glu Thr Leu Ala He His Gly Gly Phe Ala Gly Asp Pro 
1 5 10 15 

cag act cat gca gtc gcg gtc ccc att tac cag acc acc age tac tat 96 
Gin Thr His Ala Val Ala Val Pro He Tyr Gin Thr Thr Ser Tyr Tyr 
20 25 30 

ttt gat gat act cag cac ggg get gat ttg ttt gat ctg aag gtg cag 144 
Phe Asp Asp Thr Gin His Gly Ala Asp Leu Phe Asp Leu Lys Val Gin 
35 40 45 

ggt aac ate tac aca cgc ate atg aac ccg act act get gtc ctg gaa 192 
Gly Asn He Tyr Thr Arg He Met Asn Pro Thr Thr Ala Val Leu Glu 
50 55 60 

gaa aga gtg gcg tta ctg gaa gga gga gtg gga gcg ctg gec atg get 240 
Glu Arg Val Ala Leu Leu Glu Gly Gly Val Gly Ala Leu Ala Met Ala 
65 70 75 80 

tec ggc atg gec gee att aca gee tgt gtg cag act ctg gee agg gcg 288 
Ser Gly Met Ala Ala He Thr Ala Cys Val Gin Thr Leu Ala Arg Ala 
85 90 95 

ggc gac aac att ate tec acc age cag gtt tac ggt ggc acc tat aat 336 
Gly Asp Asn He He Ser Thr Ser Gin Val Tyr Gly Gly Thr Tyr Asn 
100 105 110 



ttc ttt tgc cat acg ttg ccc aat ctg ggt att gaa gtt cgc atg gtg 384 
Phe Phe Cys Hi s Thr Leu Pro Asn Leu Gly He Glu Val Arg Met Val 
115 120 125 
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gat ggt cgt aat ccg gcc get ttt gec gat gec ate gat gac aat acc 432 
Asp Gly Arg Asn Pro Ala Ala Phe Ala Asp Ala lie Asp Asp Asn Thr 
130 135 140 

aga atg att tat tgc gag teg ate gga aat ccg gcc ggt aat gtg gtg 480 
Arg Met He Tyr Cys Glu Ser He Gly Asn Pro Ala Gly Asn Val Val 
145 150 155 160 

gat ate gcc gca ctg get gaa gtg gcg cat gca gcg ggc gtg ccg ctg 528 
Asp lie Ala Ala Leu Ala Glu Val Ala His Ala Ala Gly Val Pro Leu 
165 170 175 

gta gtg gac aat acc gta cca acc ccg gtg ctt tgt cgt cct ttc gaa 576 
Val Val Asp Asn Thr Val Pro Thr Pro Val Leu Cys Arg Pro Phe Glu 
180 185 190 

cat ggt gcc gat ate gtc gtc cat gcg ctg acc aaa tac atg ggt ggt 624 
His Gly Ala Asp He Val Val His Ala Leu Thr Lys Tyr Met Gly Gly 
195 200 205 

cac ggc acc age ate ggc gga ate ate gtg gat tec ggc aag ttc ccc 672 
His Gly Thr Ser He Gly Gly He He Val Asp Ser Gly Lys Phe Pro 
210 215 220 

tgg gaa ggc aac teg cgt ttt cca caa ttc aac caa cct gat ccc age 720 
Trp Glu Gly Asn Ser Arg Phe Pro Gin Phe Asn Gin Pro Asp Pro Ser 
225 230 235 240 

tat cac ggt gtg gtt tat gtg gat gca ttt ggt ccg get gcg ttt ate 768 
Tyr His Gly Val Val Tyr Val Asp Ala Phe Gly Pro Ala Ala Phe He 
245 250 255 

ggc cgt gcg cgt gtg gta ccg ttg cgc aac atg gga gcg gca att tea 816 
Gly Arg Ala Arg Val Val Pro Leu Arg Asn Met Gly Ala Ala He Ser 
260 265 270 

cct ttc aat tct ttt ctg att ctg caa ggt ate gaa acc ctg ccg ttg 864 
Pro Phe Asn Ser Phe Leu He Leu Gin Gly He Glu Thr Leu Pro Leu 
275 280 285 

agg atg gaa egg cat tgc acc aat gcg ctg gcg att gca cgt tat ctg 912 
Arg Met Glu Arg His Cys Thr Asn Ala Leu Ala He Ala Arg Tyr Leu 
290 295 300 

caa agg cat ccc aaa gtc age tgg gtc aat ttt gcc ggc ctt gaa gat 960 
Gin Arg His Pro Lys Val Ser Trp Val Asn Phe Ala Gly Leu Glu Asp 
305 310 315 320 

aac cgt gat tac gca ctg gtg cag aaa tac atg gat ggc ggt att ccc 1008 
Asn Arg Asp Tyr Ala Leu Val Gin Lys Tyr Met Asp Gly Gly He Pro 
325 330 335 

tea teg att ctg agt ttt ggc ate aag ggc ggg cgc gag get tgt get 1056 
Ser Ser He Leu Ser Phe Gly He Lys Gly Gly Arg Glu Ala Cys Ala 
340 345 350 

cgc ttt atg gac aga ctg atg ctg ate aaa egg ctg gtc aac ate ggg 1104 
Arg Phe Met Asp Arg Leu Met Leu He Lys Arg Leu Val Asn He Gly 
355 360 365 



gat gcc aaa acg ctg gcc tgc cac ccg gcg acg acc acc cac cgt cag 1152 
Asp Ala Lys Thr Leu Ala Cys His Pro Ala Thr Thr Thr His Arg Gin 
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370 375 380 

etc aat gat gaa gaa ctg gca aaa gec ggt gtc agt get gat ctg gtg 1200 
Leu Asn Asp Glu Glu Leu Ala Lys Ala Gly Val Ser Ala Asp lieu Val 
385 390 395 400 

cgt tta tgt gtc ggc ate gag cat att gac gat ctg att gec gat gta 1248 
Arg Leu Cys Val Gly lie Glu His lie Asp Asp Leu lie Ala Asp Val 
405 410 415 

gag cag get ttc cag gat tag 1269 
Glu Gin Ala Phe Gin Asp 
420 



<210> 26 

<211> 422 

<212> PRT 

<213> Nitrosomonas europaea 



<400> 26 

Met Lys Arg Glu Thx Leu Ala lie His Gly Gly Phe Ala Gly Asp Pro 
15 10 15 

Gin Thr His Ala Val Ala Val Pro lie Tyr Gin Thr Thx Ser Tyr Tyr 
20 25 30 



Phe Asp Asp Thr Gin His Gly Ala 
35 40 



Gly Asn lie Tyr Thr Arg He Met 
50 55 



Glu Arg Val Ala Leu Leu Glu Gly 
65 70 



Ser Gly Met Ala Ala He Thr Ala 
85 



Asp Leu Phe Asp Leu Lys Val Gin 
45 

Asn Pro Thr Thr Ala Val Leu Glu 
60 

Gly Val Gly Ala Leu Ala Met Ala 
75 80 

Cys Val Gin Thr Leu Ala Arg Ala 
90 95 



Gly Asp Asn lie lie Ser Thr Ser Gin Val Tyr Gly Gly Thr Tyr Asn 
100 105 110 



Phe Phe Cys His Thr Leu Pro Asn Leu Gly He Glu Val Arg Met Val 
115 120 125 



Asp Gly Arg Asn Pro Ala Ala Phe Ala Asp Ala lie Asp Asp Asn Thr 
130 135 140 
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Arg Met lie Tyr Cys Glu Ser He Gly Asn Pro Ala Gly Asn Val Val 
145 150 155 160 

Asp He Ala Ala Leu Ala Glu Val Ala His Ala Ala Gly Val Pro Leu 
165 170 175 

Val Val Asp Asn Thr Val Pro Thr Pro Val Leu Cys Arg Pro Phe Glu 
180 185 190 

His Gly Ala Asp lie Val Val His Ala Leu Thr Lys Tyr Met Gly Gly 
195 200 205 

His Gly Thr Ser He Gly Gly He He Val Asp Ser Gly Lys Phe Pro 
210 215 220 



Trp Glu Gly Asn Ser Arg Phe Pro Gin Phe Asn Gin Pro Asp Pro Ser 
225 230 235 240 



Tyr His Gly Val Val Tyr Val Asp Ala Phe Gly Pro Ala Ala Phe He 
245 250 255 



Gly Arg Ala Arg Val Val Pro Leu Arg Asn Met Gly Ala Ala He Ser 
260 265 270 



Pro Phe Asn Ser Phe Leu He Leu Gin Gly He Glu Thr Leu Pro Leu 
275 280 285 



Arg Met Glu Arg His Cys Thr Asn Ala Leu Ala He Ala Arg Tyr Leu 
290 295 300 



Gin Arg His Pro Lys Val Ser Trp Val Asn Phe Ala Gly Leu Glu Asp 
305 310 315 320 



Asn Arg Asp Tyr Ala Leu Val Gin Lys Tyr Met Asp Gly Gly He Pro 
325 330 335 



Ser Ser He Leu Ser Phe Gly He Lys Gly Gly Arg Glu Ala Cys Ala 
340 345 350 



Arg Phe Met Asp Arg Leu Met Leu He Lys Arg Leu Val Asn He Gly 
355 360 365 



Asp Ala Lys Thr Leu Ala Cys His Pro Ala Thr Thr Thr His Arg Gin 
370 375 380 



Leu Asn Asp Glu Glu Leu Ala Lys Ala Gly Val Ser Ala Asp Leu Val 
385 390 395 400 
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Arg Leu Cys Val Gly He Glu His He Asp Asp Leu He Ala Asp Val 
405 410 415 



Glu Gin Ala Phe Gin Asp 
420 



<210> 27 

<211> 1281 

<212> DNA 

<213> Sinorhizobiura meliloti 
<220> 

<221> CDS 

<222> (1)..(1281) 

<223> 



<400> 27 

atg aaa gcc gga ccc gga ttc age acg ctt gca att cac gec ggg gec 48 
Met Lys Ala Gly Pro Gly Phe Ser Thr Leu Ala He His Ala Gly Ala 
1 5 10 15 

cag ccc gat ccg acg acc ggt gcg egg gcg acg ccg ate tat cag acg 96 
Gin Pro Asp Pro Thr Thr Gly Ala Arg Ala Thr Pro He Tyr Gin Thr 
20 25 30 

acc age ttc gtc ttc aac gac acg gat cat gcg gcc gca etc ttc ggc 144 
Thr Ser Phe Val Phe Asn Asp Thr Asp His Ala Ala Ala Leu Phe Gly 
35 40 45 

etc cag caa ttc ggc ' aat ate tat acc cgc ate atg aat ccg acg cag 192 
Leu Gin Gin Phe Gly Asn He Tyr Thr Arg He Met Asn Pro Thr Gin 
50 55 60 

gcg gtg ctg gag gag egg ate gcg gcg etc gaa ggc ggg acc gcc ggg 240 
Ala Val Leu Glu Glu Arg He Ala Ala Leu Glu Gly Gly Thr Ala Gly 
65 70 75 80 



ctg gcc gtt tec teg ggg cat gcg gcc cag ctg ctg gtt ttc cat acg 
Leu Ala Val Ser Ser Gly His Ala Ala Gin Leu Leu Val Phe His Thr 
85 90 95 

ate atg agg ccg ggt gac aat ttc gtt tec gcc aga cag ctt tac ggc 
He Met Arg Pro Gly Asp Asn Phe Val Ser Ala Arg Gin Leu Tyr Gly 
100 105 110 



288 



336 



ggg teg gcc aat cag ttc ggc cat gcc ttc aag gcc ttc gac tgg cag 384 
Gly Ser Ala Asn Gin Phe Gly His Ala Phe Lys Ala Phe Asp Trp Gin 
115 120 125 
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gtc cgc tgg gcc gat teg gcg gag ccc gaa age ttc gat gcg cag ate 432 
Val Arg Trp Ala Asp Ser Ala Glu Pro Glu Ser Phe Asp Ala Gin lie 
130 135 140 

gac gaa cgc acc aag gcg ate ttc ate gaa age etc gcc aat ccg ggc 480 
Asp Glu Arg Thr Lys Ala lie Phe lie Glu Ser lieu Ala Asn Pro Gly 
145 150 155 160 

ggc acc ttc gtc gac ata gcc gca ate get gac gtt gcg egg cga cac 528 
Gly Thr Phe Val Asp lie Ala Ala lie Ala Asp Val Ala Arg Arg His 
165 170 175 

gga ctg ccg etc ate gtc gac aat acg atg gcg acg ccc tat ctg atg 576 
Gly Leu Pro Leu lie Val Asp Asn Thr Met Ala Thr Pro Tyr Leu Met 
180 185 ISO 

egg ccg etc gaa cac ggc gcc gat ate gtc gtc cat teg etc acc aag 624 
Arg Pro Leu Glu His Gly Ala Asp lie Val Val His Ser Leu Thr Lys 
195 200 205 

ttc ate ggc ggt cac ggc aat teg atg ggc ggc ate ate gtc gac ggc 672 
Phe He Gly Gly His Gly Asn Ser Met Gly Gly He lie Val Asp Gly 
210 215 220 

ggt acg ttc gac tgg teg aaa tec ggc aag tat ccg ctg ctg teg gag 720 
Gly Thr Phe Asp Trp Ser Lys Ser Gly Lys Tyr Pro Leu Leu Ser Glu 
225 230 235 240 

ccg agg ccc gaa tat ggc ggc gtc gtc ctg cac cag gcc ttc ggc aac 768 
Pro Arg Pro Glu Tyr Gly Gly Val Val Leu His Gin Ala Phe Gly Asn 
245 250 255 

ttc gcc ttc gcc ate gcc gca egg gta ttg ggt ctg agg gac ttc ggt 816 
Phe Ala Phe Ala He Ala Ala Arg Val Leu Gly Leu Arg Asp Phe Gly 
260 265 270 

ccg gcc att teg ccc ttc aac gcc ttc ctg ate cag acc ggc gtc gag 864 
Pro Ala He Ser Pro Phe Asn Ala Phe Leu He Gin Thr Gly Val Glu 
275 280 285 

acg ctg ccg ctg agg atg cag cgc cat tgc gac aac gcg ctg gag gtc 912 
Thr Leu Pro Leu Arg Met Gin Arg His Cys Asp Asn Ala Leu Glu Val 
290 295 300 



gcc aaa tgg ctg aag gga cat gaa aag gtc tec tgg gtc cgc tat tec 
Ala Lys Trp Leu Lys Gly His Glu Lys Val Ser Trp Val Arg Tyr Ser 
305 310 315 320 



960 



ggg etc gaa gac gat ccg aac cac gca ctg cag aaa cgc tac teg ccg 1008 
Gly Leu Glu Asp Asp Pro Asn His Ala Leu Gin Lys Arg Tyr Ser Pro 
325 330 33S 



aag ggg gcg gga gcc gtt ttc acc ttc ggg etc gcg ggc gga tac gag 
Lys Gly Ala Gly Ala Val Phe Thr Phe Gly Leu Ala Gly Gly Tyr Glu 
340 345 350 



1056 



gcg gga aag cgc ttt gtc gag gca ctg gaa atg ttc tec cat ctt gcc 1104 
Ala Gly Lys Arg Phe Val Glu Ala Leu Glu Met Phe Ser His Leu Ala 
355 360 365 

aat ate ggc gac acg cgt teg etc gtc ate cac ccc gca teg acc acg 1152 
Asn He Gly Asp Thr Arg Ser Leu Val He His Pro Ala Ser Thr Thr 
370 375 380 
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cac egg cag etc acg ccg gag cag cag gtc gee gca ggc gee gga ccc 1200 
His Arg Gin Leu Thr Pro Glu Gin Gin Val Ala Ala Gly Ala Gly Pro 
385 390 395 400 

gac gtc ate egg ttg teg gtc ggc ate gag gat gtg gec gac ate att 1248 
Asp Val lie Arg Leu Ser Val Gly lie Glu Asp Val Ala Asp lie lie 
405 410 415 

gee gat etc gaa cag gcg ctg ggc aag gee tga 1281 
Ala Asp Leu Glu Gin Ala Leu Gly Lys Ala 
420 425 



<210> 28 

<211> 426 

<212> PRT 

<213> Sinorhizobium meliloti 

<400> 28 

Met Lys Ala Gly Pro Gly Phe Ser Thr Leu Ala lie His Ala Gly Ala 
x 5 10 15 

Gin Pro Asp Pro Thr Thr Gly Ala Arg Ala Thr Pro lie Tyr Gin Thr 
20 25 30 

Thr Ser Phe Val Phe Asn Asp Thr Asp His Ala Ala Ala Leu Phe Gly 
35 40 45 

Leu Gin Gin Phe Gly Asn lie Tyr Thr Arg lie Met Asn Pro Thr Gin 
50 55 60 

Ala Val Leu Glu Glu Arg lie Ala Ala Leu Glu Gly Gly Thr Ala Gly 
65 70 75 80 

Leu Ala Val Ser Ser Gly His Ala Ala Gin Leu Leu Val Phe His Thr 
85 90 95 

lie Met Arg Pro Gly Asp Asn Phe Val Ser Ala Arg Gin Leu Tyr Gly 
100 105 110 

Gly Ser Ala Asn Gin Phe Gly His Ala Phe Lys Ala Phe Asp Trp Gin 
115 120 125 

Val Arg Trp Ala Asp Ser Ala Glu Pro Glu Ser Phe Asp Ala Gin He 
130 135 140 



Asp Glu Arg Thr Lys Ala He Phe He Glu Ser Leu Ala Asn Pro Gly 



WO 2004/024933 
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145 150 155 160 



Gly Thr Phe Val Asp He Ala Ala He Ala Asp Val Ala Arg Arg His 
165 170 175 



Gly Leu Pro Leu He Val Asp Asn Thr Met Ala Thr Pro Tyr Leu Met 
180 185 190 

Arg Pro Leu Glu His Gly Ala Asp He Val Val His Ser Leu Thr Lys 
195 200 205 

Phe He Gly Gly His Gly Asn Ser Met Gly Gly He lie Val Asp Gly 
210 215 220 

Gly Thr Phe Asp Trp Ser Lys Ser Gly Lys Tyr Pro Leu Leu Ser Glu 
225 230 235 240 

Pro Arg Pro Glu Tyr Gly Gly Val Val Leu His Gin Ala Phe Gly Asn 
245 250 255 

Phe Ala Phe Ala He Ala Ala Arg Val Leu Gly Leu Arg Asp Phe Gly 
260 265 270 

Pro Ala He Ser Pro Phe Asn Ala Phe Leu He Gin Thr Gly Val Glu 
275 280 285 

Thr Leu Pro Leu Arg Met Gin Arg His Cys Asp Asn Ala Leu Glu Val 
290 295 300 

Ala Lys Trp Leu Lys Gly His Glu Lys Val Ser Trp Val Arg Tyr Ser 
305 310 315 320 

Gly Leu Glu Asp Asp Pro Asn His Ala Leu Gin Lys Arg Tyr Ser Pro 
325 330 335 

Lys Gly Ala Gly Ala Val Phe Thr Phe Gly Leu Ala Gly Gly Tyr Glu 
340 345 350 

Ala Gly Lys Arg Phe Val Glu Ala Leu Glu Met Phe Ser His Leu Ala 
355 360 365 

Asn He Gly Asp Thr Arg Ser Leu Val He His Pro Ala Ser Thr Thr 
370 375 380 



His Arg Gin Leu Thr Pro Glu Gin Gin Val Ala Ala Gly Ala Gly Pro 
385 390 395 400 
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Asp Val He Arg Leu Ser Val Gly He Glu Asp Val Ala Asp He He 
405 410 415 

Ala Asp Leu Glu Gin Ala Leu Gly Lys Ala 
420 425 

<210> 29 
<211> 1293 
<212> DNA 

<213> Thermotoga maritima 



<220> 

<221> CDS 

<222> (1)..(1293) 

<223> 



<400> 29 

atg gac tgg aag aaa tac ggt tac aac aca agg get ctt cac gca ggt 48 
Met Asp Trp Lys Lys Tyr Gly Tyr Asn Thr Arg Ala Leu His Ala Gly 
X 5 10 15 

tat gaa cca ccc gag cag gec aca gga teg aga gcg gtc cct ata tat 96 
Tyr Glu Pro Pro Glu Gin Ala Thr Gly Ser Arg Ala Val Pro He Tyr 
20 25 30 

caa acg act tct tac gtt ttc aga gac tct gat cac gcg gcg aga etc 144 
Gin Thr Thr Ser Tyr Val Phe Arg Asp Ser Asp His Ala Ala Arg Leu 
35 40 45 

ttc gca ctg gaa gaa cct ggg ttc ate tat aca agg att gga aat cct 192 
Phe Ala Leu Glu Glu Pro Gly Phe He Tyr Thr Arg He Gly Asn Pro 
50 55 60 

acc gtc tea gtt ctt gaa gaa aga ata gee gec ctg gaa gaa ggg gtg 240 
Thr Val Ser Val Leu Glu Glu Arg He Ala Ala Leu Glu Glu Gly Val 
65 70 75 80 

gga gec tta gcg gtt gec agt gga caa gec get ata act tac gec att 2 88 

Gly Ala Leu Ala Val Ala Ser Gly Gin Ala Ala He Thr Tyr Ala He 
85 90 95 

ttg aac ate gcg ggc cca gga gat gag ate gtc age ggg age gcg ctg 336 
Leu Asn He Ala Gly Pro Gly Asp Glu He Val Ser Gly Ser Ala Leu 
100 105 110 

tat ggg gga acg tac aat ctg ttc aga cac act etc tat aaa aaa tec 3 84 

Tyr Gly Gly Thr Tyr Asn Leu Phe Arg His Thr Leu Tyr Lys Lys Ser 
115 120 125 



ggc ate ate gtg aag ttt gtg gat gag aca gat cca aag aac ata gaa 
Gly He He Val Lys Phe Val Asp Glu Thr Asp Pro Lys Asn He Glu 



432 
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130 135 140 

gag gcc ate acc gag aaa aca aag gcg gtg tac ctt gaa act ate ggg 480 
Glu Ala lie Thr* Glu Lys Thr Lys Ala Val Tyr Leu Glu Thr He Gly 
145 150 155 160 



aat ccc ggt etc aca gtg ccg gac ttt gaa gcg ata gcg gag ate get 
Asn Pro Gly Leu Thr Val Pro Asp Phe Glu Ala He Ala Glu He Ala 
165 170 175 



528 



cac aga cac ggt gtt cct ttg ata gtg gac aat acg gta get ccg tac 576 
His Arg His Gly Val Pro Leu He Val Asp Asn Thr Val Ala Pro Tyr 
180 185 190 

ata ttc agg ccc ttc gaa cac ggt gcc gac ate gtt gtt tat teg gcc 624 
He Phe Arg Pro Phe Glu His Gly Ala Asp He Val Val Tyr Ser Ala 
195 200 2 05 

acg aaa ttc ate gga gga cac gga aca teg ata ggc ggt etc ate gta 672 
Thr Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly Leu He Val 
210 215 220 

gac age gga aaa ttc gac tgg acg aac gga aag ttt cca gaa etc gtg 720 
Asp Ser Gly Lys Phe Asp Trp Thr Asn Gly Lys Phe Pro Glu Leu Val 
225 230 235 240 

gaa cca gat ccc age tac cac ggt gtg agt tat gtg gag acg ttc aaa 768 
Glu Pro Asp Pro Ser Tyr His Gly Val Ser Tyr Val Glu Thr Phe Lys 
245 250 255 

gaa gca gcc tac ata gca aaa tgt aga acc cag ctt ttg agg gac ctg 816 
Glu Ala Ala Tyr He Ala Lys Cys Arg Thr Gin Leu Leu Arg Asp Leu 
260 265 270 

gga age tgt atg age ccg ttc aac gcg ttt ctg ttc ate etc gga ctt 864 
Gly Ser Cys Met Ser Pro Phe Asn Ala Phe Leu Phe He Leu Gly Leu 
275 280 285 

gaa acc etc age ttg agg atg aag aaa cac tgt gaa aac gca ctg aag 912 
Glu Thr Leu Ser Leu Arg Met Lys Lys His Cys Glu Asn Ala Leu Lys 
290 295 300 



ate gtt gaa ttt ctg aaa teg cat ccc gcc gtg age tgg gtc aac tat 
He Val Glu Phe Leu Lys Ser His Pro Ala Val Ser Trp Val Asn Tyr 
305 310 315 ^ 320 



960 



ccg ata get gaa ggc aat aaa acc aga gaa aat gcg ctg aaa tac etc 1008 
Pro He Ala Glu Gly Asn Lys Thr Arg Glu Asn Ala Leu Lys Tyr Leu 
325 330 335 

aaa gaa gga tac ggt gcg att gta acg ttc ggt gtg aaa ggc gga aaa 1056 
Lys Glu Gly Tyr Gly Ala He Val Thr Phe Gly Val Lys Gly Gly Lys 
340 345 350 

gag gcg gga aag aag ttc ata gac agt etc aca etc att tec cac etc 1104 
Glu Ala Gly Lys Lys Phe He Asp Ser Leu Thr Leu He Ser His Leu 
355 360 365 

gcc aac att ggt gat gca aga act ctg get att cat ccc get teg aca 1152 
Ala Asn He Gly Asp Ala Arg Thr Leu Ala He His Pro Ala Ser Thr 
370 375 380 



acc cat cag cag etc acg gaa gaa gag cag ttg aaa acg ggt gtt 



act 1200 
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Thr His Gin Gin Leu Thr Glu Glu Glu Gin Leu Lys Thr Gly Val Thr 
385 390 395 400 

ccg gat atg ata aga ttg tct gtt gga ata gaa gat gtg gaa gat ate 
Pro Asp Met lie Arg Leu Ser Val Gly lie Glu Asp Val Glu Asp lie 
405 410 415 



1248 



ata gec gat ctg gat cag get etc aga aaa tct cag gag gga tga 1293 
lie Ala Asp Leu Asp Gin Ala Leu Arg Lys Ser Gin Glu Gly 
420 425 430 



<210> 30 

<211> 430 

<212> PRT 

<213> Thermotoga maritima 

<400> 30 

Met Asp Trp Lys Lys Tyr Gly Tyr Asn Thr Arg Ala Leu His Ala Gly 
1 5 10 15 

Tyr Glu Pro Pro Glu Gin Ala Thr Gly Ser Arg Ala Val Pro lie Tyr 
20 25 30 

Gin Thr Thr Ser Tyr Val Phe Arg Asp Ser Asp His Ala Ala Arg Leu 
35 40 45 

Phe Ala Leu Glu Glu Pro Gly Phe He Tyr Thr Arg He Gly Asn Pro 
50 55 60 

P Thr Val Ser Val Leu Glu Glu Arg lie Ala Ala Leu Glu Glu Gly Val 
65 70 75 80 

Gly Ala Leu Ala Val Ala Ser Gly Gin Ala Ala lie Thr Tyr Ala He 
85 90 95 

Leu Asn He Ala Gly Pro Gly Asp Glu He Val Ser Gly Ser Ala Leu 
100 105 HO 

Tyr Gly Gly Thr Tyr Asn Leu Phe Arg His Thr Leu Tyr Lys Lys Ser 
115 120 125 

Gly lie lie Val Lys Phe Val Asp Glu Thr Asp Pro Lys Asn He Glu 
130 135 140 



Glu Ala lie Thr Glu Lys Thr Lys Ala Val Tyr Leu Glu Thr He Gly 
n45 150 155 160 
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Asn Pro Gly Leu Thr Val Pro Asp Phe Glu Ala lie Ala Glu lie Ala 
165 170 175 

His Arg His Gly Val Pro Leu He Val Asp Asn Thr Val Ala Pro Tyr 
180 185 190 

He Phe Arg Pro Phe Glu His Gly Ala Asp He Val Val Tyr Ser Ala 
195 200 205 

Thr Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly Leu He Val 
210 215 220 

Asp Ser Gly Lys Phe Asp Trp Thr Asn Gly Lys Phe Pro Glu Leu Val 
225 230 235 240 

Glu Pro Asp Pro Ser Tyr His Gly Val Ser Tyr Val Glu Thr Phe Lys 
245 250 255 

Glu Ala Ala Tyr He Ala Lys Cys Arg Thr Gin Leu Leu Arg Asp Leu 
260 265 270 

Gly Ser Cys Met Ser Pro Phe Asn Ala Phe Leu Phe He Leu Gly lieu 
275 280 285 

Glu Thr Leu Ser Leu Arg Met Lys Lys His Cys Glu Asn Ala Leu Lys 
290 295 300 

He Val Glu Phe Leu Lys Ser His Pro Ala Val Ser Trp Val Asn Tyr 
305 310 315 320 

Pro He Ala Glu Gly Asn Lys Thr Arg Glu Asn Ala Leu Lys Tyr Leu 
325 330 335 

Lys Glu Gly Tyr Gly Ala He Val Thr Phe Gly Val Lys Gly Gly Lys 
340 345 350 

Glu Ala Gly Lys Lys Phe He Asp Ser Leu Thr Leu He Ser His Leu 
355 360 365 

Ala Asn He Gly Asp Ala Arg Thr Leu Ala He His Pro Ala Ser Thr 
370 375 380 

Thr His Gin Gin Leu Thr Glu Glu Glu Gin Leu Lys Thr Gly Val Thr 
385 390 395 * 400 



Pro Asp Met He Arg Leu Ser Val Gly He Glu Asp Val Glu Asp He 



£1/110 
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405 410 415 

lie Ala Asp Leu Asp Gin Ala Leu Arg Lys Ser Gin Glu Gly 
420 425 430 



<210> 31 

<211> 1314 

<212> DNA 

<213> Streptococcus mutans 
<220> 

<221> CDS 

<222> (1) . - (1314) 

<223> 



<400> 31 

atg gag eta att aat aat aaa agg aga get tec atg act cga gaa ttt 
Met Glu Leu lie Asn Asn Lys Arg Arg Ala Ser Met Thr Arg Glu Plie 
! 5 10 15 

tct ttt gaa act tta caa tta cat gcg gga caa agt gtt gat cct aca 
Ser Phe Glu Thr Leu Gin Leu His Ala Gly Gin Ser Val Asp Pro Thr 
20 25 30 

aca aaa teg cgt gca gta cca ate tat cag acg act tec tat gtg ttt 
Thr Lys Ser Arg Ala Val Pro lie Tyr Gin Thr Thr Ser Tyr Val Phe 
35 40 45 

aat gat gca caa gat get gaa gat tct ttt gca ctt cgt aca ccc ggc 
Asn Asp Ala Gin Asp Ala Glu Asp Ser Phe Ala Leu Arg Thr Pro Gly 
50 55 60 

aat att tat acg egg ate act aat ccg act aca gec gtt ttt gaa gaa 
Asn lie Tyr Thr Arg He Thr Asn Pro Thr Thr Ala Val Phe Glu Glu 
65 70 75 80 

egg atg gec get ctt gaa ggt ggt gtc ggt gca ctg gca aca get tct 
Arg Met Ala Ala Leu Glu Gly Gly Val Gly Ala Leu Ala Thr Ala Ser 
85 90 95 

ggt atg gca gca gta act tat att gee ttg get ctt get cat gca ggt 
Gly Met Ala Ala Val Thr Tyr He Ala Leu Ala Leu Ala His Ala Gly 
100 105 HO 

gat cat att gtg tea gca gcg aca gtt tac ggt ggc act ttt aat ctt 
Asp His He Val Ser Ala Ala Thr Val Tyr Gly Gly Thr Phe Asn Leu 
115 120 125 

ctt aag gaa act tta cct cgc tat ggc att act aca agt ttt gtt gat 
Leu Lys Glu Thr Leu Pro Arg Tyr Gly He Thr Thr Ser Phe Val Asp 
130 135 140 



48 



96 



144 



192 



240 



288 



336 



384 



432 
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gtt get aat ttc get gaa att gaa gcg get att aca gac aag act aag 48 0 

Val Ala Asn Phe Ala Glu He Glu Ala Ala He Thr Asp Lys Thr Lys 
145 ISO 155 160 

ttt att ate get gaa acg tta gga aat cct ctt gga aat ate get gat 528 
Phe He He Ala Glu Thr Leu Gly Asn Pro Leu Gly Asn He Ala Asp 
165 170 175 

ctt gaa aaa tta get gag att gee cat cga cat get att ccc ttg gtt 576 
Leu Glu Lys Leu Ala Glu He Ala His Arg His Ala He Pro Leu Val 
180 185 ^ 190 

att gat aat ace ttt ggt act cct tat ttg ctt aat gtc ttc tct tac 624 
He Asp Asn Thr Phe Gly Thr Pro Tyr Leu Leu Asn Val Phe Ser Tyr 
195 200 205 

ggt gtt gat att get gtt cat tct gee act aaa ttt ate ggt gga cat 672 
Gly Val Asp He Ala Val His Ser Ala Thr Lys Phe He Gly Gly His 
210 215 220 

ggg aca tct att ggc ggt gtc att gtt gat tct gga aac ttt gat tgg 720 
Gly Thr Ser He Gly Gly Val He Val Asp Ser Gly Asn Phe Asp Trp 
225 230 235 240 

gaa aaa tct gga aaa ttc cca caa ttt gta gaa cca gat cct tec tat 768 
Glu Lys Ser Gly Lys Phe Pro Gin Phe Val Glu Pro Asp Pro Ser Tyr 
245 250 255 

cat gac att agt tat aca cgt gat att gga aaa gca get ttt gta act 816 
His Asp He Ser Tyr Thr Arg Asp He Gly Lys Ala Ala Phe Val Thr 
260 265 270 

gcg gtg cgt acg caa ctg ctg cgt gat aca ggc gec tgc ctt tea cct 864 
Ala Val Arg Thr Gin Leu Leu Arg Asp Thr Gly Ala Cys Leu Ser Pro 
275 280 285 

ttc aat gec ttt ctt ttg eta caa ggt eta gaa ace tta tea ctt cgt 912 
Phe Asn Ala Phe Leu Leu Leu Gin Gly Leu Glu Thr Leu Ser Leu Arg 
290 295 300 

gtt gag cgt cat gtg gaa aat get aag aaa att gcg tac tat ctg gaa 960 
Val Glu Arg His Val Glu Asn Ala Lys Lys He Ala Tyr Tyr Leu Glu 
305 310 315 320 

aat cat cct aaa gtc aca aaa gtt aat tat get agt ttg cca tea agt 1008 
Asn His Pro Lys Val Thr Lys Val Asn Tyr Ala Ser Leu Pro Ser Ser 
325 330 335 

cct tat tat gac ttg get caa aaa tac ttg cca aaa gga get agt tct 1056 
Pro Tyr Tyr Asp Leu Ala Gin Lys Tyr Leu Pro Lys Gly Ala Ser Ser 
340 345 ' 350 

ate ttt act ttt aat gtt gca ggc agt gcg aaa gee get cgc gag gtc 1104 
He Phe Thr Phe Asn Val Ala Gly Ser Ala Lys Ala Ala Arg Glu Val 
355 360 " 365 

att gac agt ctt gaa ate ttt tct gat ttg gcg aat gtt get gat gee 1152 
He Asp Ser Leu Glu He Phe Ser Asp Leu Ala Asn Val Ala Asp Ala 
370 375 380 

aaa tea eta gtt gtt cat ccg gca aca acc act eat ggt caa atg act 1200 
Lys Ser Leu Val Val His Pro Ala Thr Thr Thr His Gly Gin Met Thr 
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385 390 395 400 

gaa gaa gat eta cga get tgc ggt att gaa cct gag caa ate cgt gtt 1248 
Glu Glu Asp Leu Arg Ala Cys Gly lie Glu Pro Glu Gin lie Arg Val 
405 410 415 

tct att ggt ttg gaa aat get gat gac tta ate gaa gat ttg cgc eta 1296 
Ser lie Gly Leu Glu Asn Ala Asp Asp Leu He Glu Asp Leu Arg Leu 
420 425 430 

gca ctt gaa aaa ata taa 1314 
Ala Leu Glu Lys lie 
435 

<210> 32 

<211> 437 

<212> PRT 

<213> Streptococcus mutans 



<400> 32 

Met Glu Leu He Asn Asn Lys Arg Arg Ala Ser Met Thr Arg Glu Phe 
15 10 15 



Ser Phe Glu Thr Leu Gin Leu His Ala Gly Gin Ser Val Asp Pro Thr 
20 25 30 



Thr Lys Ser Arg Ala Val Pro He Tyr Gin Thr Thr Ser Tyr Val Phe 
35 40 45 



Asn Asp Ala Gin Asp Ala Glu Asp Ser Phe Ala Leu Arg Thr Pro Gly 
50 55 60 



Asn He Tyr Thr Arg lie Thr Asn Pro Thr Thr Ala Val Phe Glu Glu 
65 70 75 80 

Arg Met Ala Ala Leu Glu Gly Gly Val Gly Ala Leu Ala Thr Ala Ser 
85 90 95 



Gly Met Ala Ala Val Thr Tyr He Ala Leu Ala Leu Ala His Ala Gly 
100 105 110 



Asp His lie Val Ser Ala Ala Thr Val Tyr Gly Gly Thr Phe Asn Leu 
115 120 125 



Leu Lys Glu Thr Leu Pro Arg Tyr Gly He Thr Thr Ser Phe Val Asp 
130 135 140 
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Val Ala Asn Phe Ala Glu He Glu Ala Ala He Thr Asp Lys Thr Lys 
145 150 155 160 

Phe He He Ala Glu Thr Leu Gly Asn Pro Leu Gly Asn He Ala Asp 
165 170 175 

Leu Glu Lys Leu Ala Glu He Ala His Arg His Ala He Pro Leu Val 
180 185 190 

He Asp Asn Thr Phe Gly Thr Pro Tyr Leu Leu Asn Val Phe Ser Tyr 
1^5 200 205 

Gly Val Asp He Ala Val His Ser Ala Thr Lys Phe He Gly Gly His 
210 215 220 

Gly Thr Ser He Gly Gly Val He Val Asp Ser Gly Asn Phe Asp Trp 
225 230 235 240 

Glu Lys Ser Gly Lys Phe Pro Gin Phe Val Glu Pro Asp Pro Ser Tyr 
245 250 255 

His Asp He Ser Tyr Thr Arg Asp He Gly Lys Ala Ala Phe Val Thr 
260 265 270 

Ala Val Arg Thr Gin Leu Leu Arg Asp Thr Gly Ala Cys Leu Ser Pro 
275 280 285 

Phe Asn Ala Phe Leu Leu Leu Gin Gly Leu Glu Thr Leu Ser Leu Arg 
290 295 300 

Val Glu Arg His Val Glu Asn Ala Lys Lys He Ala Tyr Tyr Leu Glu 
305 310 315 320 

Asn His Pro Lys Val Thr Lys Val Asn Tyr Ala Ser Leu Pro Ser Ser 
325 330 335 

Pro Tyr Tyr Asp Leu Ala Gin Lys Tyr Leu Pro Lys Gly Ala Ser Ser 
340 345 350 

He Phe Thr Phe Asn Val Ala Gly Ser Ala Lys Ala Ala Arg Glu Val 
355 360 365 

He Asp Ser Leu Glu He Phe Ser Asp Leu Ala Asn Val Ala Asp Ala 
370 3 75 3 80 



Lys Ser Leu Val Val His Pro Ala Thr Thr Thr His Gly Gin Met Thr 
385 390 395 * 400 



WO 2004/024933 
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Glu Glu Asp Leu Arg Ala Cys Gly lie Glu Pro Glu Gin He Arg Val 
405 410 415 



Ser He Gly Leu Glu Asn Ala Asp Asp Leu He Glu Asp Leu Arg Leu 
420 425 430 



Ala Leu Glu Lys He 
435 



<210> 33 

<211> 1431 

<212> DMA 

<213> Burkholderia cepacia 

<220> 

<221> CDS 

<222> (1) - . (1431) 

<223> 



<400> 33 

ttg aag cgc cgc acg ccg gtg ata gga tgg ccg cca ctt tea cct ttc 

Leu Lys Arg Arg Thr Pro Val He Gly Trp Pro Pro Leu Ser Pro Phe 
x ^ 5 10 15 

gcg agg ccg tec gtg gec ccg ccg ccc age atg tec gcg aac cgt ttc 
Ala Arg Pro Ser Val Ala Pro Pro Pro Ser Met Ser Ala Asn Arg Phe 
20 25 30 

gac acg ctt gcg ctg cac gee ggc get get ccc gac ccg ace acc ggc 
Asp Thr Leu Ala Leu His Ala Gly Ala Ala Pro Asp Pro Thr Thr Gly 
35 40 45 

gcg cgc gec acg ccg att tac cag act acc teg ttt teg ttc cgc gat 
Ala Arg Ala Thr Pro He Tyr Gin Thr Thr Ser Phe Ser Phe Arg Asp 
50 55 60 

tec gac cac gec gcg gcg etc ttc aat atg gag cgc gee ggt cat gtt 
Ser Asp His Ala Ala Ala Leu Phe Asn Met Glu Arg Ala Gly His Val 
65 70 75 80 

tat teg cgc att teg aac ccg acc gtg gee gtg ttc gag gaa cgc gtg 
Tyr Ser Arg He Ser Asn Pro Thr Val Ala Val Phe Glu Glu Arg Val 
85 90 95 



48 



96 



144 



192 



240 



288 



gee gcg ctg gaa aac ggc gcg ggc gcg ate ggc acg gca age ggc cag 336 

Ala Ala Leu Glu Asn Gly Ala Gly Ala He Gly Thr Ala Ser Gly Gin 
100 105 no 

gcg gee ctg cat ctg gec att gee acg ctg atg ggc gcg ggt teg cat 384 
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Ala Ala Leu His Leu Ala lie Ala Thr Leu Met Gly Ala Gly Ser His 
115 120 125 

ate gtc gee tec age gcg ctg tac ggc ggc teg cae aat ctg ctg cac 432 
lie Val Ala Ser Ser Ala Leu Tyr Gly Gly Ser His Asn Leu Leu His 
130 135 140 

tac acg ttg egg cgc ttc ggc ate gag acg act ttc gtc aaa ccc ggc 480 
Tyr Thr Leu Arg Arg Phe Gly lie Glu Thr Thr Phe Val Lys Pro Gly 
145 150 155 160 

gac ctg gac gcg tgg cgc gec gcg ctg cgc cca aac acg egg ctg ctg 528 
Asp Leu Asp Ala Trp Arg Ala Ala Leu Arg Pro Asn Thr Arg Leu Leu 
165 170 175 

ttc ggc gag acg etc ggc aat ccg ggg etc gac gtg etc gat ate gec 576 
Phe Gly Glu Thr Leu Gly Asn Pro Gly Leu Asp Val Leu Asp He Ala 
180 185 190 

gec gtc gcg cag ate gcg cat gag cac cgc gtg ccg ctg ctg gtc gac 624 
Ala Val Ala Gin He Ala His Glu His Arg Val Pro Leu Leu Val Asp 
195 200 205 

teg acc ttc acc aca cct tac ctg etc aaa ccg ttc gaa cat ggc gcg 672 
Ser Thr Phe Thr Thr Pro Tyr Leu Leu Lys Pro Phe Glu His Gly Ala 
210 215 220 

gac ttc gtc tat cac teg gec acc aaa ttc etc ggc ggc cac ggc acg 720 
Asp Phe Val Tyr His Ser Ala Thr Lys Phe Leu Gly Gly His Gly Thr 
225 230 235 240 

acg ate ggc ggc gtg ctg gtg gac ggc ggc acg ttc gac ttc gac gee 768 
Thr lie Gly Gly Val Leu Val Asp Gly Gly Thr Phe Asp Phe Asp Ala 
245 250 " 255 

tog ggg cgc ttc ccc gaa ttc acc gaa cct tac gac ggc ttt cac ggc 816 
Ser Gly Arg Phe Pro Glu Phe Thr Glu Pro Tyr Asp Gly Phe His Gly 
260 265 270 

atg gtg ttc gec gag gag age acc gtc gcg ccg ttt ctg ctg oga gca 864 
Met Val Phe Ala Glu Glu Ser Thr Val Ala Pro Phe Leu Leu Arg Ala 
275 280 285 

cgc cgc gag ggg ctg cgc gac ttc ggc gca tgc ctg cat ccg caa gec 912 
Arg Arg Glu Gly Leu Arg Asp Phe Gly Ala Cys Leu His Pro Gin Ala 
290 295 300 

gca tgg caa ctg ctg caa ggc ate gag acg ctg ccg ttg cga atg gaa 960 
Ala Trp Gin Leu Leu Gin Gly He Glu Thr Leu Pro Leu Arg Met Glu 
305 310 315 ^ 320 

egg cac gtt gee aac acg cgc egg gtg gtc gag ttc etc gee ggt cac 1008 
Arg His Val Ala Asn Thr Arg Arg Val Val Glu Phe Leu Ala Gly His 
325 330 335 

gee gcg gtc ggg gee gtc gec tat ccg gaa ctg ccc acg cac ccc gac 1056 
Ala Ala Val Gly Ala Val Ala Tyr Pro Glu Leu Pro Thr His Pro Asp 
340 345 350 



cac gcg etc gcg aag egg ctg ctg ccg cgc ggc gee ggt gee gtg ttc 1104 
His Ala Leu Ala Lys Arg Leu Leu Pro Arg Gly Ala Gly Ala Val Phe 
355 360 365 



WO 2004/024933 



67/130 
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age ttc gat ctg cgc ggc gac cgc gec gec gga cgc age ttt ate gaa 
Ser Phe Asp Leu Arg Gly Asp Arg Ala Ala Gly Arg Ser Phe lie Glu 
370 375 380 

gcg etc teg ctg ttc teg cat etc gcg aac gtg ggc gac gcg cgc teg 
Ala Leu Ser Leu Phe Ser His Leu Ala Asn Val Gly Asp Ala Arg Ser 
385 390 395 400 

etc gtg ate cat ccc gec teg ace ace cac ttt cgc atg gac gec get 
Leu Val He His Pro Ala Ser Thr Thr His Phe Arg Met Asp Ala Ala 
405 410 415 

gec ctt gee gcg gec ggt ate gec gaa ggc acg ate cgc etc teg ate 
Ala Leu Ala Ala Ala Gly He Ala Glu Gly Thr He Arg Leu Ser He 
420 425 430 



1152. 



1200 



1248 



1296 



ggc etc gaa gat ccc gac gat ctg ate gac gat etc aag cgc gcg eta 

Gly Leu Glu Asp Pro Asp Asp Leu He Asp Asp Leu Lys Arg Ala Leu 
435 440 445 

aag gec gca cag aaa gcg ggc agt teg age gca gcg cac ggc ggc gca 

Lys Ala Ala Gin Lys Ala Gly Ser Ser Ser Ala Ala His Gly Gly Ala 
450 455 460 

tec ggc agt gee gee caa ccc cgc ccg gag tec gca tga 
Ser Gly Ser Ala Ala Gin Pro Arg Pro Glu Ser Ala 
465 470 475 



1344 



1392 



1431 



<210> 34 

<211> 476 

<212> PRT 

<213> Burkholderia cepacia 

<400> 34 

Leu Lys Arg Arg Thr Pro Val He Gly Trp Pro Pro Leu Ser Pro Phe 
I S 10 15 

Ala Arg Pro Ser Val Ala Pro Pro Pro Ser Met Ser Ala Asn Arg Phe 
20 25 30 

Asp Thr Leu Ala Leu His Ala Gly Ala Ala Pro Asp Pro Thr Thr Gly 
35 40 45 



Ala Arg Ala Thr Pro He Tyr Gin Thr Thr Ser Phe Ser Phe Arg Asp 
50 55 60 



Ser Asp His Ala Ala Ala Leu Phe Asn Met Glu Arg Ala Gly His Val 
65 70 75 80 



Tyr Ser Arg He Ser Asn Pro Thr Val Ala Val Phe Glu Glu Arg Val 
85 / 90 95 
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Ala Ala Leu Glu Asn Gly Ala Gly Ala He Gly Thr Ala Ser Gly Gin 
100 105 110 

Ala Ala Leu His Leu Ala He Ala Thr Leu Met Gly Ala Gly Ser His 
115 120 125 

He Val Ala Ser Ser Ala Leu Tyr Gly Gly Ser His Asn Leu Leu His 
130 135 140 

Tyr Thr Leu Arg Arg Phe Gly He Glu Thr Thr Phe Val Lys Pro Gly 
^45 150 155 160 

Asp Leu Asp Ala Trp Arg Ala Ala Leu Arg Pro Asn Thr Arg Leu Leu 
165 170 175 

Phe Gly Glu Thr Leu Gly Asn Pro Gly Leu Asp Val Leu Asp He Ala 
180 185 190 

Ala Val Ala Gin lie Ala His Glu His Arg Val Pro Leu Leu Val Asp 
195 200 205 

Ser Thr Phe Thr Thr Pro Tyr Leu Leu Lys Pro Phe Glu His Gly Ala 
210 215 220 

Asp Phe Val Tyr His Ser Ala Thr Lys Phe Leu Gly Gly His Gly Thr 
225 230 235 * 240 

Thr lie Gly Gly Val Leu Val Asp Gly Gly Thr Phe Asp Phe Asp Ala 
245 250 2S5 

Ser Gly Arg Phe Pro Glu Phe Thr Glu Pro Tyr Asp Gly Phe His Gly 
260 265 270 

Met Val Phe Ala Glu Glu Ser Thr Val Ala Pro Phe Leu Leu Arg Ala 
275 280 285 

Arg Arg Glu Gly Leu Arg Asp Phe Gly Ala Cys Leu His Pro Gin Ala 
290 295 300 

Ala Trp Gin Leu Leu Gin Gly He Glu Thr Leu Pro Leu Arg Met Glu 
305 310 315 320 

Arg His Val Ala Asn Thr Arg Arg Val Val Glu Phe Leu Ala Gly His 
325 330 335 



Ala Ala Val Gly Ala Val Ala Tyr Pro Glu Leu Pro Thr His Pro Asp 



% V 
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340 345 350 

His Ala Leu Ala Lys Arg Leu Leu Pro Arg Gly Ala Gly Ala Val Phe 
355 360 365 

Ser Phe Asp Leu Arg Gly Asp Arg Ala Ala Gly Arg Ser Phe He Glu 
370 375 380 

Ala Leu Ser Leu Phe Ser His Leu Ala Asn Val Gly Asp Ala Arg Ser 
385 390 395 400 

Leu Val He His Pro Ala Ser Thr Thr His Phe Arg Met Asp Ala Ala 
405 410 415 

Ala Leu Ala Ala Ala Gly He Ala Glu Gly Thr He Arg Leu Ser He 
420 425 430 

Gly Leu Glu Asp Pro Asp Asp Leu He Asp Asp Leu Lys Arg Ala Leu 
435 440 445 

Lys Ala Ala Gin Lys Ala Gly Ser Ser Ser Ala Ala His Gly Gly Ala 
450 455 460 

Ser Gly Ser Ala Ala Gin Pro Arg Pro Glu Ser Ala 
465 470 475 

<210> 35 

<211> 1722 

<212> DNA 

<213> Deinococcus radiodurans 



<220> 

<221> CDS 

<222> (1)..(1722) 

<223> 



<400> 35 

gtg gcc ttc ccg tgc ggt cag gcg ggg aac aag ata aca agg ccg ggc 48 

Val Ala Phe Pro Cys Gly Gin Ala Gly Asn Lys He Thr Arg Pro Gly 
1 5 10 15 

caa tgt gtc aac ggg ggc agg gca cgc tea gcc ccg tct aag ttt cgc 96 

Gin Cys Val Asn Gly Gly Arg Ala Arg Ser Ala Pro Ser Lys Phe Arg 
20 25 30 
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ctt gac ccc tta ccc gcc tec gcg eta ctt ttt gag gag etc ccg cag 144 
Leu Asp Pro Leu Pro Ala Ser Ala Leu Leu Phe Glu <3lu Leu Pro Gin 
35 40 45 

cag gag cca ccc act tea gag cgc ccg aga gac ctg get cga cga egg 192 
Gin Glu Pro Pro Thr Ser Glu Arg Pro Arg Asp Leu Ala Arg Arg Arg 
50 55 60 

cgc ggc aac egg acc cca tea cgt cac ggt gcc aag gcc age ccc ctg 240 
Arg Gly Asn Arg Thr Pro Ser Arg His Gly Ala Lys Ala Ser Pro Leu 
65 70 75 80 

ggc gtg tea acg atg age cgc egg gcg gga cca age ggg aag gcc acg 2 88 

Gly Val Ser Thr Met Ser Arg Arg Ala Gly Pro Ser Gly Lys Ala Thr 
85 90 95 

egg atg acg ata ttc aag tgt ccc ttc teg att cac age agg cag ggg 336 
Arg Met Thr lie Phe Lys Cys Pro Phe Ser lie His Ser Arg Gin Gly 
100 105 110 

gag tgc cgt gac tgg cgc ccc cga acc tgc ttc ccc cga gga gcc gcc 3 84 

Glu Cys Arg Asp Trp Arg Pro Arg Thr Cys Phe Pro Arg Gly Ala Ala 
115 120 125 

acc atg acc gat acc aaa cag ccg cag cct ctg cac ttc gag acc ttg 432 
Thr Met Thr Asp Thr Lys Gin Pro Gin Pro Leu His Phe Glu Thr Leu 
130 135 140 

cag gtg cac gcc gga caa cgc ccc gac ccc gtg acc gga gcg cag caa 480 
Gin Val His Ala Gly Gin Arg Pro Asp Pro Val Thr Gly Ala Gin Gin 
145 150 155 160 



acg ccc ate tac gcc acc aac tec tac gtg ttc gag teg ccc gag cac 
Thr Pro lie Tyr Ala Thr Asn Ser Tyr Val Phe Glu Ser Pro Glu His 



165 170 175 



528 



gcc gcc gac etc ttc ggg ctg egg caa ttc ggc aac ate tac age cgc 576 
Ala Ala Asp Leu Phe Gly Leu Arg Gin Phe Gly Asn lie Tyr Ser Arg 
180 185 190 

ate atg aac ccc acc aac gac gtg ttc gag cag egg gtg gcc gcc etc 624 
lie Met Asn Pro Thr Asn Asp Val Phe Glu Gin Arg Val Ala Ala Leu 
195 200 205 

gaa ggg ggc gtg ggg gcg ctg teg gtg teg age ggg cac gcg ggg cag 672 
Glu Gly Gly Val Gly Ala Leu Ser Val Ser Ser Gly His Ala Gly Gin 
210 215 220 

etc gtg aca ttg etc acg ctg gcg cag gcg gga gac aac ate gtc teg 720 
Leu Val Thr Leu Leu Thr Leu Ala Gin Ala Gly Asp Asn lie Val Ser 
225 230 235 240 

teg ccc aac ctg tac ggc ggc acc gtc aac cag ttc cgc gtc acg etc 768 
Ser Pro Asn Leu Tyr Gly Gly Thr Val Asn Gin Phe Arg Val Thr Leu 
245 250 255 

aag egg etc ggc ate gag gtg egg ttt acc age aaa gac gag cgc ccc 816 
Lys Arg Leu Gly He Glu Val Arg Phe Thr Ser Lys Asp Glu Arg Pro 
260 265 270 

gag gaa ttc gcc gcg ctg ate gac gag cgc acg egg gcc gta tat ctg 864 
Glu Glu Phe Ala Ala Leu lie Asp Glu Arg Thr Arg Ala Val Tyr Leu 



^Wr 71/110 
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275 280 285 

gaa acc ate ggc aac ccg gcg ctg aac att ccc gat ttc gag ggc gtg 912 
Glu Thr lie Gly Asn Pro Ala Leu Asn He Pro Asp Phe Glu Gly Val 
290 * 295 300 



gcg aaa gtc gcg cac gag cac ggc gtc gcg gtg gtc gtg gac aac acc 
Ala Lys Val Ala His Glu His Gly Val Ala Val Val Val Asp Asn Thr 
305 310 315 320 

ttc ggg gec ggc gga tac tac tgc cag ccg ctg egg cac ggc gec aac 
Phe Gly Ala Gly Gly Tyr Tyr Cys Gin Pro Leu Arg His Gly Ala Asn 
325 330 335 



gtg ggc gac acc cgc acg ctg gtc att cat ccg gcg age acc acc cac 
val Gly Asp Thr Arg Thr Leu Val He His Pro Ala Ser Thr Thr His 
515 520 525 

age cag etc gac gag gtg acg cag acg aac gec ggg gtc acg ccg ggc 



960 



1008 



ate gtg ctg cac teg gcg age aag tgg ate ggc ggg cac ggc aac ggc 1056 
He Val Leu His Ser Ala Ser Lys Trp He Gly Gly His Gly Asn Gly 
340 345 350 

ate ggc ggg gtc ate gtg gac ggc ggg aac ttc gac tgg ggc age ggg 1104 
He Gly Gly Val He Val Asp Gly Gly Asn Phe Asp Trp Gly Ser Gly 
355 360 365 

egg tat ccg ctg atg acc gag ccc teg ccg agt tat cac ggg ctg aag 1152 
Arg Tyr Pro Leu Met Thr Glu Pro Ser Pro Ser Tyr His Gly Leu Lys 
370 375 380 

ttc tgg gag acg ttc ggg gaa ggc aac ggg ctg ggg ctg ccg aac ate 
Phe Trp Glu Thr Phe Gly Glu Gly Asn Gly Leu Gly Leu Pro Asn lie 
385 390 395 400 



1200 



gee ttc ate acc cgc gee cgc acc gag ggg ctg cgc gac ctg gga acg 1248 
Ala Phe He Thr Arg Ala Arg Thr Glu Gly Leu Arg Asp Leu Gly Thr 
405 410 415 

acc ctg gcg ccg cag cag gcg tgg cag ttt ctg caa ggc ctt gaa acc 1296 
Thr Leu Ala Pro Gin Gin Ala Trp Gin Phe Leu Gin Gly Leu Glu Thr 
420 425 430 

ctg age ctg cgc gee gag cgc cac gec gag aac acc ctg gcg ctg gcg 1344 
Leu Ser Leu Arg Ala Glu Arg His Ala Glu Asn Thr Leu Ala Leu Ala 
435 440 445 

cac tgg etc ate age cac ccg gac gtg aag cag gtc act tac ccc ggc 1392 
His Trp Leu He Ser His Pro Asp Val Lys Gin Val Thr Tyr Pro Gly 
450 455 460 

ctg age aac cac ccc cac tac gac egg gcg cag acc tac ttg ccg cgc 
Leu Ser Asn His Pro His Tyr Asp Arg Ala Gin Thr Tyr Leu Pro Arg 
455 470 475 480 

ggg gcg ss c 9°s g fc g ctc acc ttc g*9 ct 9 c & c 999 gg c c ss g°g gcg 

Gly Ala Gly Ala Val Leu Thr Phe Glu Leu Arg Gly Gly Arg Ala Ala 
485 490 495 



1440 



1488 



ggc gaa gcg ttt att cgc teg gtc aag ctc gcg cag cac gtc gee aac 153 6 

Gly Glu Ala Phe He Arg Ser Val Lys Leu Ala Gin His Val Ala Asn 
500 505 510 



1584 



1632 
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Ser Gin Leu Asp Glu Val Thr Gin Thr Asn Ala Gly Val Thr Pro Gly 
530 535 540 

etc ate egg gtg teg gtg ggc ate gag cac gta gac gac ate cgc gag 1680 
Leu lie Arg Val Ser Val Gly He Glu His Val Asp Asp He Arg Glu 
545 550 555 560 

gac ttc gcg cag gec ctg gcg age get ggg gag egg gcg tga 1722 
Asp Phe Ala Gin Ala Leu Ala Ser Ala Gly Glu Arg Ala 
565 570 

<210> 36 
<211> 573 
<212> PRT 

<213> Deinococcus radiodurans 



<400> 36 

Val Ala Phe Pro Cys Gly Gin Ala Gly Asn Lys He Thr Arg Pro Gly 
1 5 10 15 

Gin Cys Val Asn Gly Gly Arg Ala Arg Ser Ala Pro Ser Lys Phe Arg 
20 25 30 

Leu Asp Pro Leu Pro Ala Ser Ala Leu Leu Phe Glu Glu Leu Pro Gin 
35 40 45 

Gin Glu Pro Pro Thr Ser Glu Arg Pro Arg Asp Leu Ala Arg Arg Arg 
50 55 60 

Arg Gly Asn Arg Thr Pro Ser Arg His Gly Ala Lys Ala Ser Pro Leu 
65 70 75 80 

Gly Val Ser Thr Met Ser Arg Arg Ala Gly Pro Ser Gly Lys Ala Thr 
85 90 95 

Arg Met Thr He Phe Lys Cys Pro Phe Ser He His Ser Arg Gin Gly 
100 105 110 

Glu Cys Arg Asp Trp Arg Pro Arg Thr Cys Phe Pro Arg Gly Ala Ala 
115 120 125 

Thr Met Thr Asp Thr Lys Gin Pro Gin Pro Leu His Phe Glu Thr Leu 
130 135 140 



Gin Val His Ala Gly Gin Arg Pro Asp Pro Val Thr Gly Ala Gin Gin 
145 ISO 155 160 



% V 
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Thr Pro He Tyr Ala Thr Asn Ser Tyr Val Phe Glu Ser Pro Glu His 
165 170 175 

Ala Ala Asp Leu Phe Gly Leu Arg Gin Phe Gly Asn He Tyr Ser Arg 
180 185 190 

He Met Asn Pro Thr Asn Asp Val Phe Glu Gin Arg Val Ala Ala Leu 
195 200 205 

Glu Gly Gly Val Gly Ala Leu Ser Val Ser Ser Gly His Ala Gly Gin 
210 215 220 

Leu Val Thr Leu Leu Thr Leu Ala Gin Ala Gly Asp Asn He Val Ser 
225 230 235 240 

Ser Pro Asn Leu Tyr Gly Gly Thr Val Asn Gin Phe Arg Val Thr Leu 
245 250 255 

Lys Arg Leu Gly He Glu Val Arg Phe Thr Ser Lys Asp Glu Arg Pro 
260 265 270 

Glu Glu Phe Ala Ala Leu He Asp Glu Arg Thr Arg Ala Val Tyr Leu 
275 280 285 

Glu Thr He Gly Asn Pro Ala Leu Asn He Pro Asp Phe Glu Gly Val 
290 295 300 

Ala Lys Val Ala His Glu His Gly Val Ala Val Val Val Asp Asn Thr 
305 310 315 320 

Phe Gly Ala Gly Gly Tyr Tyr Cys Gin Pro Leu Arg His Gly Ala Asn 
325 330 335 

He Val Leu His Ser Ala Ser Lys Trp He Gly Gly His Gly Asn Gly 
340 345 350 

He Gly Gly Val He Val Asp Gly Gly Asn Phe Asp Trp Gly Ser Gly 
355 360 365 

Arg Tyr Pro Leu Met Thr Glu Pro Ser Pro Ser Tyr His Gly Leu Lys 
370 375 380 

Phe Trp Glu Thr Phe Gly Glu Gly Asn Gly Leu Gly Leu Pro Asn He 
385 390 395 400 



Ala Phe He Thr Arg Ala Arg Thr Glu Gly Leu Arg Asp Leu Gly Thr 
405 410 415 
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Thr Leu Ala Pro Gin Gin Ala Trp Gin Phe Leu Gin Gly Leu Glu Thr 
420 425 430 



Leu Ser Leu Arg Ala Glu Arg His Ala Glu Asn Thr Leu Ala Leu Ala 
435 440 445 



His Trp Leu lie Ser His Pro Asp Val Lys Gin Val Thr Tyr Pro Gly 
450 455 460 



Leu Ser Asn His Pro His Tyr Asp Arg Ala Gin Thr Tyr Leu Pro Arg 
465 470 475 480 



Gly Ala Gly Ala Val Leu Thr Phe Glu Leu Arg Gly Gly Arg Ala Ala 
485 490 4 95 



Gly Glu Ala Phe lie Arg Ser Val Lys Leu Ala Gin His Val Ala Asn 
500 505 510 



Val Gly Asp Thr Arg Thr Leu Val He His Pro Ala Ser Thr Thr His 
515 520 525 



Ser Gin Leu Asp Glu Val Thr Gin Thr Asn Ala Gly Val Thr Pro Gly 
530 535 540 



Leu He Arg Val Ser Val Gly He Glu His Val Asp Asp He Arg Glu 
545 550 555 ~ 560 



Asp Phe Ala Gin Ala Leu Ala Ser Ala Gly Glu Arg Ala 
565 570 



<210> 37 

<211> 1284 

<212> DNA 

<213> Rhodobacter capsulatus 

<220> 

<221> CDS 

<222> (1) . . (1284) 

<223> 



<400> 37 



WO 2004/024933 



\ v 
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48 



ctg ccg etc att gtc gac aac acg ctg gec teg cct tat etc tgc cgc 

Leu Pro Leu lie Val Asp Asn Thr Leu Ala Ser Pro Tyr Leu Cys Arg 
180 IBS 190 

ccg ate gag cat ggc gcg acg ctg gtt gtc cat tec gee acg aaa tac 

Pro lie Glu His Gly Ala Thr Leu Val Val His Ser Ala Thr Lys Tyr 

195 200 205 



144 



192 



atg acc gac cag gee ttt gac acg ctg caa att cac gcg ggc gec gaa 
Met Thr Asp Gin Ala Phe Asp Thr Leu Gin He His Ala Gly Ala Glu 
! 5 10 15 

ccc gat ccc gcg acg ggc gcg egg cag gtg ccg att tac cag acc acc 96 
Pro Asp Pro Ala Thr Gly Ala Arg Gin Val Pro He Tyr Gin Thr Thr 
20 25 30 

tec tat gtc ttc aag gac gee gac cat gee gcg cgc ctg ttc ggg ctg 
Ser Tyr Val Phe Lys Asp Ala Asp His Ala Ala Arg Leu Phe Gly Leu 
35 40 45 

cag gag gtg ggc tat ate tat tec cgc ctg acc aac ccg acc gtt teg 
Gin Glu Val Gly Tyr He Tyr Ser Arg Leu Thr Asn Pro Thr Val Ser 
50 55 60 

gca ctg gec gee cgc gtt gcg gcg ctt gaa ggc ggc gtg ggc gcg gtc 240 
Ala Leu Ala Ala Arg Val Ala Ala Leu Glu Gly Gly Val Gly Ala Val 
65 70 75 80 

tgc tgc teg tec ggc cat gcg gcg cag ate atg gcg ctg ttt ccg ctg 288 
Cys Cys Ser Ser Gly His Ala Ala Gin lie Met Ala Leu Phe Pro Leu 
85 90 95 

atg ggg ccg ggg ctg aac ate gtc gee teg acc egg ctt tac ggc ggc 336 
Met Gly Pro Gly Leu Asn He Val Ala Ser Thr Arg Leu Tyr Gly Gly 
100 105 HO 

acg ate acc cag ttc age cag acc ate aaa cgc ttc ggc tgg tec tgc 384 
Thr He Thr Gin Phe Ser Gin Thr He Lys Arg Phe Gly Trp Ser Cys 
115 120 125 

acc ttt gtc gat ttc gac gat ctg gcg gcg etc gag gec gcg gtg gat 
Thr Phe Val Asp Phe Asp Asp Leu Ala Ala Leu Glu Ala Ala Val Asp 
130 ^ "5 140 

gac aac acc egg gcg ate ttt tgc gaa teg ate teg aac ccg ggc ggc 
Asp Asn Thr Arg Ala He Phe Cys Glu Ser He Ser Asn Pro Gly Gly 
14 5 150 155 160 

tac ate acc gac ctg ccc gec gtc gcg gcg gtg gcg aac aag gtc ggc 528 
Tvx He Thr Asp Leu Pro Ala Val Ala Ala Val Ala Asn Lys Val Gly 
165 170 175 



432 



480 



576 



624 



ctg acc ggc aac ggc acg gtg acg ggc ggg gtg ate gtc gat teg ggc 672 
Leu Thr Gly Asn Gly Thr Val Thr Gly Gly Val He Val Asp Ser Gly 
210 215 220 

aag ttc gac tgg teg gee teg ggc aag ttc ccc age ctt teg gcg ccc 72 0 

Lys Phe Asp Trp Ser Ala Ser Gly Lys Phe Pro Ser Leu Ser Ala Pro 
225 ^ 230 235 240 

gaa ccc gec tat cac ggg ctg aag ttc cac gag gca etc ggc ccg atg 768 
Glu Pro Ala Tyr His Gly Leu Lys Phe His Glu Ala Leu Gly Pro Met 
245 250 255 
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gcc ttc acc ttc cat teg ate gec gtc ggg ctg cgc gat ctg ggc atg 816 
Ala Phe Thr Phe His Ser lie Ala Val Gly Leu Arg Asp Leu Gly Met 
260 265 270 

acg atg aac ccg cag ggc gcg cat tac acg ctg atg ggg ate gag acg 864 
Thr Met Asn Pro Gin Gly Ala His Tyr Thr Leu Met Gly lie Glu Thr 
275 280 285 

etc age ctg cgc atg gac aag cac gtc gcc aat gcg aag gcg gtg gcg 912 
Leu Ser Leu Arg Met Asp Lys His Val Ala Asn Ala Lys Ala Val Ala 
290 295 300 

gaa tgg ctg gcc aaa gac ccg cgc ate gac ttc gtc acc tgg gcc ggg 960 
Glu Trp Leu Ala Lys Asp Pro Arg He Asp Phe Val Thr Trp Ala Gly 
305 310 315 320 

ctg ccc tec teg ccc tgg cac gaa cgc gcc gag egg ctt tgc ccg aag 1008 
Leu Pro Ser Ser Pro Trp His Glu Arg Ala Glu Arg Leu Cys Pro Lys 
325 330 335 

ggg gcg ggg gcg ctt ttc acc gtc gcg gtc aag ggc ggc tat gag gcc 1056 
Gly Ala Gly Ala Leu Phe Thr Val Ala Val Lys Gly Gly Tyr Glu Ala 
340 345 350 

tgc gtg aaa ttg gtc aac aat etc aag ctg ttc age cat gtg gca aac 1104 
Cys Val Lys Leu Val Asn Asn Leu Lys Leu Phe Ser His Val Ala Asn 
355 360 365 

ctg ggc gac gcg cgc teg ctg ate ate cat teg gcc teg acc acg cac 1152 
Leu Gly Asp Ala Arg Ser Leu lie He His Ser Ala Ser Thr Thr His 
370 375 380 

cgt cag ctg acc gag gaa cag cag ate aag gcg ggg gcg gcg ccg aat 1200 
Arg Gin Leu Thr Glu Glu Gin Gin lie Lys Ala Gly Ala Ala Pro Asn 
385 390 395 400 

gtg gtg egg etc teg ate ggg ate gag aat gcc gcc gat ctg ate gcc 1248 
Val Val Arg Leu Ser He Gly He Glu Asn Ala Ala Asp Leu He Ala 
405 410 415 

gat ctg gat cag get ctg gcc gcc gcc acc gcc tga 1284 
Asp Leu Asp Gin Ala Leu Ala Ala Ala Thr Ala 
420 425 

<210> 38 
<211> 427 
<212> PRT 

<213> Rhodobacter capsulatus 



<400> 38 

Met Thr Asp Gin Ala Phe Asp Thr Leu Gin He His Ala Gly Ala Glu 
15 10 15 



Pro Asp Pro Ala Thr Gly Ala Arg Gin Val Pro He Tyr Gin Thr Thr 
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20 25 30 



Ser Tyr Val Phe Lys Asp Ala Asp His Ala Ala Arg Leu Phe Gly Leu 
35 40 45 



Gin Glu Val Gly Tyr lie Tyr Ser Arg Leu Thr Asn Pro Thr Val Ser 
50 55 60 



Ala Leu Ala Ala Arg Val Ala Ala Leu Glu Gly Gly Val Gly Ala Val 
65 70 75 80 



Cys Cys Ser Ser Gly His Ala Ala Gin He Met Ala Leu Phe Pro Leu 
85 90 95 



Met Gly Pro Gly Leu Asn lie Val Ala Ser Thr Arg Leu Tyr Gly Gly 
100 105 110 



Thr He Thr Gin Phe Ser Gin Thr He Lys Arg Phe Gly Trp Ser Cys 
115 120 125 

Thr Phe Val Asp Phe Asp Asp Leu Ala Ala Leu Glu Ala Ala Val Asp 
130 135 14 0 

Asp Asn Thr Arg Ala lie Phe Cys Glu Ser He Ser Asn Pro Gly Gly 
145 150 155 160 

Tyr He Thr Asp Leu Pro Ala Val Ala Ala Val Ala Asn Lys Val Gly 
165 170 175 



Leu Pro Leu He Val Asp Asn Thr Leu Ala Ser Pro Tyr Leu Cys Arg 
180 185 190 



Pro He Glu His Gly , Ala Thr Leu Val Val His Ser Ala Thr Lys Tyr 
195 200 205 

Leu Thr Gly Asn Gly Thr Val Thr Gly Gly Val He Val Asp Ser Gly 
210 215 220 

Lys Phe Asp Trp Ser Ala Ser Gly Lys Phe Pro Ser Leu Ser Ala Pro 
225 230 235 240 

Glu Pro Ala Tyr His Gly Leu Lys Phe His Glu Ala Leu Gly Pro Met 
245 250 255 



Ala Phe Thr Phe His Ser He Ala Val Gly Leu Arg Asp Leu Gly Met 
260 265 270 
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Thr Met Asn Pro Gin Gly Ala His Tyr Thr Leu Met Gly lie Glu Thr 
275 280 285 

Leu Ser Leu Arg Met Asp Lys His Val Ala Asn Ala Lys Ala Val Ala 
290 295 300 

Glu Trp Leu Ala Lys Asp Pro Arg lie Asp Phe Val Thr Trp Ala Gly 
305 310 315 320 

Leu Pro Ser Ser Pro Trp His Glu Arg Ala Glu Arg Leu Cys Pro Lys 
325 330 335 

Gly Ala Gly Ala Leu Phe Thr Val Ala Val Lys Gly Gly Tyr Glu Ala 
340 345 350 

Cys Val Lys Leu Val Asn Asn Leu Lys Leu Phe Ser His Val Ala Asn 
355 360 365 

Leu Gly Asp Ala Arg Ser Leu lie He His Ser Ala Ser Thr Thr His 
370 375 380 

Arg Gin Leu Thr Glu Glu Gin Gin He Lys Ala Gly Ala Ala Pro Asn 
385 390 395 400 

Val Val Arg Leu Ser He Gly He Glu Asn Ala Ala Asp Leu He Ala 
405 410 415 

Asp Leu Asp Gin Ala Leu Ala Ala Ala Thr Ala 
420 425 

<210> 39 
<211> 1269 
<212> DNA 

<213> Pasteurella multocida 



<220> 

<221> CDS 

<222> (1) - . (1269) 

<223> 



<400> 39 

atg gaa ttt gca aca aaa tgt eta cat gec ggt tat aca ccg aaa aat 
Met Glu Phe Ala Thr Lys Cys Leu His Ala Gly Tyr Thr Pro Lys Asn 



48 
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96 



1 S 10 15 

ggt qag cct cgt gtt caa ccg ate gta caa agt acc act ttt acc tac 
Gly Glu Pro Arg Val Gin Pro lie Val Gin Ser Thr Thr Phe Thr Tyr 
20 25 30 

gat tec gec gaa gaa att ggt aag tta ttt gat tta caa gcg get ggc 144 
Asp Ser Ala Glu Glu He Gly Lys Leu Phe Asp Leu Gin Ala Ala Gly 
35 40 45 

tat ttt tac acc cgc ctt tea aat cct act acc aat gcg gca gaa gaa 192 
Tyr Phe Tyr Thr Arg Leu Ser Asn Pro Thr Thr Asn Ala Ala Glu Glu 
SO 55 60 

aaa att acc gca ctt gaa ggc ggt gta gca acc atg tgt acc gca tea 240 
Lvs He Thr Ala Leu Glu Gly Gly Val Ala Thr Met Cys Thr Ala Ser 
65 70 75 80 

ggg caa gee gee gtg ttt tac gcg atg etc aat att tta caa gee ggt 288 
Glv Gin Ala Ala Val Phe Tyr Ala Met Leu Asn He Leu Gin Ala Gly 
W 85 90 95 

gat cac ttt att tct tea teg tat gtt tac ggt ggt age tac aac tta 
Asp His Phe He Ser Ser Ser Tyr Val Tyr Gly Gly Ser Tyr Asn Leu 
100 105 110 

ttt gca cat acc ttc aaa aaa atg gga att gag gtc act ttt gtg gat 
Phe Ala His Thr Phe Lys Lys Met Gly He Glu Val Thr Phe Val Asp 
115 12 0 125 

caa _ at tta cct ctt gag gaa tta aaa aaa get att cgc cca aat acg 
Gin Asp Leu Pro Leu Glu Glu Leu Lys Lys Ala He Arg Pro Asn Thr 
130 135 140 

aaa gee att ttt gee gaa act att gee aat ccc gca tta cgc gtg ttg 
Lvs Ala He Phe Ala Glu Thr He Ala Asn Pro Ala Leu Arg Val Leu 
!4 5 ISO 155 ISO 

gat att gaa aag ttt gtt gca ctt gcg aag gca gca caa gee cct tta 
<^ Asr> He Glu Lys Phe Val Ala Leu Ala Lys Ala Ala Gin Ala Pro Leu 
W 165 170 175 

tta gtt gac aat act ttt gca acc ccg tat ttt tgt cgc cct ate gaa 576 
Leu val Asp Asn Thr Phe Ala Thr Pro Tyr Phe Cys Arg Pro He Glu 
180 185 I 90 

ttt ggt get aac gtg gta att cat agt acg tea aaa tat tta gat ggg 624 
Phe Gly Ala Asn Val Val He His Ser Thr Ser Lys Tyr Leu Asp Gly 
19S 200 20S 

cat gcg att gcg ttg gga ggt teg ate aca gat ggc ggg aat ttt gat 672 
His Ala He Ala Leu Gly Gly Ser He Thr Asp Gly Gly Asn Phe Asp 
210 215 220 

tgg aat aat ggt aaa ttc cca caa tta age aca cct gat caa act tat 720 
Trp Asn Asn Gly Lys Phe Pro Gin Leu Ser Thr Pro Asp Gin Thr Tyr 
225 230 23S 240 

cac ggt tta gtt tat acc gaa acc ttt gtt cca gec get tat att gtc 
His Gly Leu Val Tyr Thr Glu Thr Phe Val Pro Ala Ala Tyr He Val 
245 250 255 

aaa gec cgt gtg caa tta atg cgt gat tta ggt gee aca cca gca cca 



336 



3 84 



432 



480 



528 



768 



816 
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Lys Ala Arg Val Gin Leu Met Arg Asp Leu Gly Ala Thr Pro Ala Pro 
260 265 270 

caa aat agt ttc ttg etc aat gtg ggc atg gaa act ctt gca ctg cgt 864 
Gin Asn Ser Phe Leu Leu Asn Val Gly Met Glu Thr Leu Ala Leu Arg 
275 280 285 

atg caa cgt cat tat gaa aat gca caa gcg gtc gec gaa ttt tta gaa 912 
Met Gin Arg His Tyr Glu Asn Ala Gin Ala Val Ala Glu Phe Leu Glu 
290 295 300 

aat cat cca caa gtg gca aaa gtg agt tat ccg ggc ttg gca agt tea 960 
Asn His Pro Gin Val Ala Lys Val Ser Tyr Pro Gly Leu Ala Ser Ser 
305 310 315 320 

cct gat cat gca eta aaa caa aaa tat tta cca aac ggt tta tgt ggt 1008 
Pro Asp His Ala Leu Lys Gin Lys Tyr Leu Pro Asn Gly Leu Cys Gly 
325 330 335 

gtg att tec ttt gaa att aga ggg gga aga gaa act gca gca aaa tgg 1056 
Val lie Ser Phe Glu He Arg Gly Gly Arg Glu Thr Ala Ala Lys Trp 
340 345 350 

ctg aat gcg eta caa ctg get tct cgt gaa gtc cat gta gcg gat att 1104 
Leu Asn Ala Leu Gin Leu Ala Ser Arg Glu Val His Val Ala Asp He 
355 360 365 

cgc act tgt get tta cat ccg gcg acg tea aca cac cgt caa tta agt 1152 
Arg Thr Cys Ala Leu His Pro Ala Thr Ser Thr His Arg Gin Leu Ser 
370 375 380 

gag get gaa tta gaa aaa gtg ggg att tct gcg ggt tta att cgt ctt 1200 
Glu Ala Glu Leu Glu Lys Val Gly lie Ser Ala Gly Leu He Arg Leu 
385 390 395 ^ 400 

tct tgc ggt att gaa agt ate caa gat att ttg get gac tta gaa caa 1248 
Ser Cys Gly He Glu Ser He Gin Asp He Leu Ala Asp Leu Glu Gin 
405 410 * 415 

gca ttc cac gcg gca aaa taa 1269 
Ala Phe His Ala Ala Lys 
420 

<210> 40 
<211> 422 
<212> PRT 

<213> Pasteurella multocida 



<400> 40 

Met Glu Phe Ala Thr Lys Cys Leu 
1 5 



His Ala Gly Tyr Thr Pro Lys Asn 
10 is 



Gly Glu Pro Arg Val Gin Pro He Val Gin Ser Thr Thr Phe Thr Tyr 
20 25 30 



WO 2004/024933 W ^J>CT/EP2003/009453 

81/130 

Asp Ser Ala Glu Glu lie Gly Lys Leu Phe Asp Leu Gin Ala Ala Gly 
35 40 45 

Tyr Phe Tyr Thr Arg Leu Ser Asn Pro Thr Thr Asn Ala Ala Glu Glu 
50 55 60 

Lys He Thr Ala Leu Glu Gly Gly Val Ala Thr Met Cys Thr Ala Ser 
65 70 75 80 

Gly Gin Ala Ala Val Phe Tyr Ala Met Leu Asn He Leu Gin Ala Gly 
BS 90 95 

Asp His Phe He Ser Ser Ser Tyr Val Tyr Gly Gly Ser Tyr Asn Leu 
100 105 110 

Phe Ala His Thr Phe Lys Lys Met Gly He Glu Val Thr Phe Val Asp 
115 120 125 

Gin Asp Leu Pro Leu Glu Glu Leu Lys Lys Ala He Arg Pro Asn Thr 
130 135 140 

Lys Ala He Phe Ala Glu Thr He Ala Asn Pro Ala Leu Arg Val Leu 
145 150 155 160 

Asp He Glu Lys Phe Val Ala Leu Ala Lys Ala Ala Gin Ala Pro Leu 
165 170 175 

Leu Val Asp Asn Thr Phe Ala Thr Pro Tyr Phe Cys Arg Pro He Glu 
180 185 190 

Phe Gly Ala Asn Val Val He His Ser Thr Ser Lys Tyr Leu Asp Gly 
195 200 205 

His Ala He Ala Leu Gly Gly Ser He Thr Asp Gly Gly Asn Phe Asp 
210 215 220 

Trp Asn Asn Gly Lys Phe Pro Gin Leu Ser Thr Pro Asp Gin Thr Tyr 
225 230 235 240 

His Gly Leu Val Tyr Thr Glu Thr Phe Val Pro Ala Ala Tyr lie Val 
245 250 255 

Lys Ala Arg Val Gin Leu Met Arg Asp Leu Gly Ala Thr Pro Ala Pro 
260 265 270 



Gin Asn Ser Phe Leu Leu Asn Val Gly Met Glu Thr Leu Ala Leu Arg 
275 280 285 
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Met Gin Arg His Tyr Glu Asn Ala Gin Ala Val Ala Glu Phe Leu Glu 
290 295 300 



Asn His Pro Gin VaJ. Ala Lys Val Ser Tyr Pro Gly Leu Ala Ser Ser 
305 310 315 320 



Pro Asp His Ala Leu Lys Gin Lys Tyr Leu Pro Asn Gly Leu Cys Gly 
325 330 335 



Val lie Ser Phe Glu He Arg Gly Gly Arg Glu Thr Ala Ala Lys Trp 
340 345 350 



Leu Asn Ala Leu Gin Leu Ala Ser Arg Glu Val His Val Ala Asp He 
355 360 365 



Arg Thr Cys Ala Leu His Pro Ala Thr Ser Thr His Arg Gin Leu Ser 
370 375 380 



Glu Ala Glu Leu Glu Lys Val Gly He Ser Ala Gly Leu lie Arg Leu 
385 390 395 400 



Ser Cys Gly He Glu Ser He Gin Asp He Leu Ala Asp Leu Glu Gin 
405 410 4X5 



Ala Phe His Ala Ala Lys 
420 



<210> 41 

<211> 1266 

<212> DNA 

<213> Clostridium ' difficile 
<220> 

<221> CDS 

<222> (1) . . (1266) 

<223> 



<400> 41 

atg tat aat aaa gaa aca ata tgt gtg caa gga aat tat aaa cca ggt 48 

Met Tyr Asn Lys Glu Thr He Cys Val Gin Gly Asn Tyr Lys Pro Gly 
1 5 10 15 
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aat gga gaa cca aga gta eta cct tta tat caa agt aca act ttt aaa 96 
Asn Gly Glu Pro Arg Val Leu Pro Leu Tyx Gin Ser Thr Thr Phe Lys 
20 25 30 

tat age agt ata gac caa ctt get gaa tta ttt gat tta aaa gtt gat 144 
Tyr Ser Ser lie Asp Gin Leu Ala Glu Leu Phe Asp Leu Lys Val Asp 
35 40 45 

gga cat ata tat tea aga ata age aat cct act att caa get ttt gaa 192 
Gly His lie Tyr Ser Arg lie Ser Asn Pro Thr He Gin Ala Phe Glu 
50 55 60 

gaa aaa ata agt tta eta gag ggt gga gta tct tct gta get gta tea 240 
Glu Lys He Ser Leu Leu Glu Gly Gly Val Ser Ser Val Ala Val Ser 
65 70 75 80 

tea ggg caa tct gca aat atg ttg gca gtt tta aat ata tgt aaa tea 288 
Ser Gly Gin Ser Ala Asn Met Leu Ala Val Leu Asn lie Cys Lys Ser 
B5 90 95 

gga gat agt ata ctt tgt tct tea aaa gta tat gga gga aca ttc aat 336 
Gly Asp Ser lie Leu Cys Ser Ser Lys Val Tyr Gly Gly Thr Phe Asn 
100 105 110 

tta eta gga cct agt ctt aaa aaa ttt ggt ata gat tta ata teg ttt 3 84 

Leu Leu Gly Pro Ser Leu Lys Lys Phe Gly He Asp Leu He Ser Phe 
115 120 125 

gac tta gat tea agt gaa gat gag ata gta gaa ctt gca aag gaa aat 432 
Asp Leu Asp Ser Ser Glu Asp Glu He Val Glu Leu Ala Lys Glu Asn 
130 135 140 

act aag gtt gtg ttt gca gaa aca ctt gca aat cca act ctt gaa gtc 480 
Thr Lys Val Val Phe Ala Glu Thr Leu Ala Asn Pro Thr Leu Glu Val 
145 150 155 160 

ata gat ttt gaa aaa ata gca aat gta get aag aga att aat gtt cca 528 
He Asp Phe Glu Lys He Ala Asn Val Ala Lys Arg He Asn Val Pro 
165 170 175 

ttt att gtt gat aat tea tta gca tct cca gtg ctt tgt aac cct tta 576 
Phe He Val Asp Asn Ser Leu Ala Ser Pro Val Leu Cys Asn Pro Leu 
180 185 190 

aag tat gga gca aat ata gtt act cat tct ace aca aaa tat tta gat 624 
Lys Tyr Gly Ala Asn He Val Thr His Ser Thr Thr Lys Tyr Leu Asp 
195 200 205 

ggg cat get tea agt gtt gga gga att ata gtg gat ggt gga aac ttt 672 
Gly His Ala Ser Ser Val Gly Gly He He Val Asp Gly Gly Asn Phe 
210 215 220 

aac tgg gat aat gga aaa ttt cca gaa tta gtt gag cca gac cca aca 720 
Asn Trp Asp Asn Gly Lys Phe Pro Glu Leu Val Glu Pro Asp Pro Thr 
225 230 235 240 

tat cat ggt ata age tat act caa aaa ttt gga aat gee gca tat gca 768 
Tyr His Gly He Ser Tyr Thr Gin Lys Phe Gly Asn Ala Ala Tyr Ala 
245 250 255 

act aaa gca aga gtt cag ttg ctt aga gac tat gga aat tgt tta age 816 
Thr Lys Ala Arg Val Gin Leu Leu Arg Asp Tyr Gly Asn Cys Leu Ser 
260 265 270 
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cca ttc aat gcg tat ctt act aat tta aat gtt gaa aca eta cat ctt 
Pro Phe Asn Ala Tyr Leu Thr Asn Leu Asn Val Glu Thr Leu His Leu 
275 280 285 

aga atg gag aga cat agt gaa aat gca ctt aaa ata get aga ttt tta 
Arg Met Glu Arg His Ser Glu Asn Ala Leu Lys lie Ala Arg Phe Leu 
290 295 300 

gaa aaa cat gaa aat gta gat tgg att aat tac cca gga ctt gaa gat 
Glu Lys His Glu Asn Val Asp Trp He Asn Tyr Pro Gly Leu Glu Asp 
305 310 315 ~ 320 

aac aag tat tat gag aat gec aaa aag tat tta tea aga gga tgt agt 
Asn Lys Tyr Tyr Glu Asn Ala Lys Lys Tyr Leu Ser Arg Gly Cys Ser 
325 330 335 

ggt gtt tta tea ttt gga gta aga ggt ggg tta gaa aat gec aaa aaa 
Gly Val Leu Ser Phe Gly Val Arg Gly Gly Leu Glu Asn Ala Lys Lys 
340 345 350 

ttt gtg gaa aaa tta cag ata gca tct ttg gtt aca cat gtt tea gat 
Phe Val Glu Lys Leu Gin He Ala Ser Leu Val Thr His Val Ser Asp 
355 360 365 

gta aga act tgt gtt ata cat cca get tea act act cat aga caa tta 
Val Arg Thr Cys Val He His Pro Ala Ser Thr Thr His Arg Gin Leu 
370 375 380 



864 



912 



960 



1008 



1056 



1104 



1152 



aca gaa gaa caa tta att gca tct gga gta ttg cct tea eta ata aga 1200 
Thr Glu Glu Gin Leu lie Ala Ser Gly Val Leu Pro Ser Leu He Arg 
385 390 395 400 

tta tct gtt gga ata gaa aat gta gag gat tta ata get gat tta aat 1248 
Leu Ser Val Gly He Glu Asn Val Glu Asp Leu He Ala Asp Leu Asn 
405 410 415 



caa get tta aat ttc taa 
Gin Ala Leu Asn Phe 
420 



1266 



<210> 42 
<211> 421 
<212> PRT 

<213> Clostridium difficile 
<400> 42 

Met Tyr Asn Lys Glu Thr He Cys Val Gin Gly Asn Tyr Lys Pro Gly 
15 10 15 



Asn Gly Glu Pro Arg Val Leu Pro Leu Tyr Gin Ser Thr Thr Phe Lys 
20 25 30 



Tyr ser Ser He Asp Gin Leu Ala Glu Leu Phe Asp Leu Lys Val Asp 
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35 40 45 



Gly His lie Tyr Ser Arg lie Ser Asn Pro Thr lie Gin Ala Phe Glu 
50 55 60 



Glu Lys lie Ser Leu Leu Glu Gly Gly Val Ser Ser Val Ala Val Ser 
€5 70 75 80 



Ser Gly Gin Ser Ala Asn Met Leu Ala Val Leu Asn lie Cys Lys Ser 
85 90 95 



Gly Asp Ser lie Leu Cys Ser Ser Lys Val Tyr Gly Gly Thr Phe Asn 
100 105 110 



Leu Leu Gly Pro Ser Leu Lys Lys Phe Gly lie Asp Leu lie Ser Phe 
115 120 125 



Asp Leu Asp Ser Ser Glu Asp Glu lie Val Glu Leu Ala Lys Glu Asn 
130 135 140 



Thr Lys Val Val Phe Ala Glu Thr Leu Ala Asn Pro Thr Leu Glu Val 
145 150 155 160 



lie Asp Phe Glu Lys lie Ala Asn Val Ala Lys Arg lie Asn Val Pro 
165 170 175 



Phe lie Val Asp Asn Ser Leu Ala Ser Pro Val Leu Cys Asn Pro Leu 
180 185 190 



Lys Tyr Gly Ala Asn lie Val Thr His Ser Thr Thr Lys Tyr Leu Asp 
195 200 205 



Gly His Ala Ser Ser Val Gly Gly lie lie Val Asp Gly Gly Asn Phe 
210 215 220 



Asn Trp Asp Asn Gly Lys Phe Pro Glu Leu Val Glu Pro Asp Pro Thr 
225 230 235 240 



Tyr His Gly lie Ser Tyr Thr Gin Lys Phe Gly Asn Ala Ala Tyr Ala 
245 250 255 



Thr Lys Ala Arg Val Gin Leu Leu Arg Asp Tyr Gly Asn Cys Leu Ser 
260 265 270 



Pro Phe Asn Ala Tyr Leu Thr Asn Leu Asn Val Glu Thr Leu His Leu 
275 280 285 
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Arg Met Glu Arg His Ser Glu Asn Ala Leu Lys lie Ala Arg Phe Leu 
290 295 300 

Glu Lys His Glu Asn Val Asp Trp lie Asn Tyr Pro Gly Leu Glu Asp 
305 310 315 320 

Asn Lys Tyr Tyr Glu Asn Ala Lys Lys Tyr Leu Ser Arg Gly Cys Ser 
325 330 335 

Gly Val Leu Ser Phe Gly Val Arg Gly Gly Leu Glu Asn Ala Lys Lys 
340 345 350 

Phe Val Glu Lys Leu Gin lie Ala Ser Leu Val Thr His Val Ser Asp 
355 360 365 

Val Arg Thr Cys Val lie His Pro Ala Ser Thr Thr His Arg Gin Leu 
370 375 380 

Thr Glu Glu Gin Leu lie Ala Ser Gly Val Leu Pro Ser Leu lie Arg 
385 390 395 400 

Leu Ser Val Gly lie Glu Asn Val Glu Asp Leu lie Ala Asp Leu Asn 
405 410 415 

Gin Ala Leu Asn Phe 
420 

<210> 43 
<211> 1272 
<212> DNA 

<213> Campylobacter jejuni 



<220> 

<221> CDS 

<222> (1)..(1272) 

<223> 



<400> 43 

atg aat ttc aat aaa gaa act tta gca tta cac gga get tat aat ttt 48 

Met Asn Phe Asn Lys Glu Thr Leu Ala Leu His Gly Ala Tyr Asn Phe 

15 10 15 



gat act caa aga agt att agt gtg cct ata tat caa aac act gcg tat 
Asp Thr Gin Arg Ser He Ser Val Pro He Tyr Gin Asn Thr Ala Tyr 



96 
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aat ttt gaa aat ttg gat caa get gca gca agg ttt aat ctt caa gaa 144 
Asn Phe Glu Asn Leu Asp Gin Ala Ala Ala Arg Phe Asn Leu Gin Glu 
35 40 45 

ctt ggc aat att tac tea aga ctt age aat cct aca age gat gtt tta 192 
Leu Gly Asn lie Tyr Ser Arg Leu Ser Asn Pro Thr Ser Asp Val Leu 
50 55 60 

gga caa aga ctt get aat gtc gaa gga ggg get ttt gga att cct gtt 240 
Gly Gin Arg Leu Ala Asn Val Glu Gly Gly Ala Phe Gly lie Pro Val 
€5 70 75 80 

get age ggt atg gca get tgt ttt tat get ctt ate aat tta gca agt 288 
Ala Ser Gly Met Ala Ala Cys Phe Tyr Ala Leu lie Asn Leu Ala Ser 
85 90 95 

teg gga gat aat gtc gcg tat teg aac aaa att tat ggt ggg act caa 336 
Ser Gly Asp Asn Val Ala Tyr Ser Asn Lys He Tyr Gly Gly Thr Gin 
100 105 ' 110 

act tta att tct cac aca ctt aaa aat ttt ggc ata gaa get agg gaa 384 
Thr Leu lie Ser His Thr Leu Lys Asn Phe Gly He Glu Ala Arg Glu 
115 120 125 

ttt gat ate gat gat tta gat age ttg gaa aaa gtt ata gat caa aac 432 
Phe Asp He Asp Asp Leu Asp Ser Leu Glu Lys Val lie Asp Gin Asn 
130 135 140 

aca aaa gcg att ttt ttc gaa agt ctt tea aat cct caa att gec ata 480 
Thr Lys Ala He Phe Phe Glu Ser Leu Ser Asn Pro Gin He Ala He 
145 150 155 160 

get gat ata gaa aaa ata aac caa ata gca aaa aaa cat aaa ate gtt 528 
Ala Asp He Glu Lys He Asn Gin He Ala Lys Lys His Lys He Val 
165 170 175 

age att tgt gat aat acc gtt get act cct ttc tta etc caa cct ttt 576 
Ser He Cys Asp Asn Thr Val Ala Thr Pro Phe Leu Leu Gin Pro Phe 
180 185 190 

aaa cat ggc gtg gat gta ate gtg cat agt tta agt aaa tat gta age 624 
Lys His Gly Val Asp Val He Val His Ser Leu Ser Lys Tyr Val Ser 
195 200 205 

ggt caa ggc act get ttg ggt gga gca ctt ata gaa aga aaa gat tta 672 
Gly Gin Gly Thr Ala Leu Gly Gly Ala Leu He Glu Arg Lys Asp Leu 
210 215 220 



aac gac ttg ctt aaa aat aac gat aga tat aaa get ttt aac act cct 
Asn Asp Leu Leu Lys Asn Asn Asp Arg Tyr Lys Ala Phe Asn Thr Pro 
225 230 235 240 



gat cca agt tat cat gga ctg aat tta aat aca ctt gat ttg ccg att 
Asp Pro Ser Tyr His Gly Leu Asn Leu Asn Thr Leu Asp Leu Pro He 
245 250 255 

ttt agt att aga gtc ate ate act tgg ctt aga gat eta gga get age 
Phe Ser He Arg Val He lie Thr Trp Leu Arg Asp Leu Gly Ala Ser 
260 265 270 

tta gca cct caa aat get tgg tta ctt tta caa gga ctt gaa acc ttg 



720 



768 



816 



864 
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Leu Ala Pro Gin Asn Ala Trp Leu Leu Leu Gin Gly Leu Glu Thr Leu 
275 280 285 

gca gtg cgt ata gaa aaa cac agt caa aat get gaa aaa gtt gcg aat 912 
Ala Val Arg He Glu Lys His Ser Gin Asn Ala Glu Lys Val Ala Asn 
290 295 300 

ttt tta aat tct cat cct gat ate aag ggc gta aat tat cct act tta 960 
Phe Leu Asn Ser His Pro Asp He Lys Gly Val Asn Tyr Pro Thr Leu 
305 310 315 320 

gca agt aat get tat cat aat tta ttt aaa aaa tat ttt gat aaa aat 1008 
Ala Ser Asn Ala Tyr His Asn Leu Phe Lys Lys Tyr Plie Asp Lys Asn 
325 330 335 

ttt get age ggg ctt tta age ttt gaa get aaa gat tat gag cat get 1056 
Phe Ala Ser Gly Leu Leu Ser Phe Glu Ala Lys Asp Tyr Glu His Ala 
340 345 350 

aga aga att tgt gat aaa act caa ctt ttc tta ctt get gca aat ttg 1104 
Arg Arg He Cys Asp Lys Thr Gin Leu Phe Leu Leu Ala Ala Asn Leu 
355 360 365 

ggt gat age aag tct ttg ate ate cat cct get tct act act cat teg 1152 
Gly Asp Ser Lys Ser Leu He He His Pro Ala Ser Thr Thr His Ser 
370 375 380 

caa eta age gaa gaa gaa etc caa aaa gca ggc att acg aaa get act 1200 
Gin Leu Ser Glu Glu Glu Leu Gin Lys Ala Gly lie Thr Lys Ala Thr 
385 390 395 400 

ata cgc tta age ata gga ctt gaa aat age gat gat ttg ata gcg gat 1248 
He Arg Leu Ser He Gly Leu Glu Asn Ser Asp Asp Leu He Ala Asp 
405 410 415 

tta aaa caa get ata gaa agt taa 1272 
Leu Lys Gin Ala He Glu Ser 
420 

<210> 44 
<211> 423 
<212> PRT 

<213> Campylobacter jejuni 



<400> 44 

Met Asn Phe Asn Lys Glu Thr Leu Ala Leu His Gly Ala Tyr Asn Phe 
1 5 10 15 

Asp Thr Gin Arg Ser He Ser Val Pro He Tyr Gin Asn Thr Ala Tyr 
20 25 30 



Asn Phe Glu Asn Leu Asp Gin Ala Ala Ala Arg Phe Asn Leu Gin Glu 
35 40 45 
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Leu Gly Asn lie Tyr Ser Arg lieu Ser Asn Pro Thr Ser Asp Val Leu 
50 55 60 



Gly Gin Arg Leu Ala Asn Val Glu Gly Gly Ala Phe Gly lie Pro Val 
65 70 75 80 



Ala Ser Gly Met Ala Ala Cys Phe Tyr Ala Leu lie Asn Leu Ala Ser 
85 90 95 



Ser Gly Asp Asn Val Ala Tyr Ser Asn Lys lie Tyr Gly Gly Thr Gin 
100 105 110 



Thr Leu He Ser His Thr Leu Lys Asn Phe Gly lie Glu Ala Arg Glu 
115 120 125 



Phe Asp He Asp Asp Leu Asp Ser Leu Glu Lys Val He Asp Gin Asn 
130 135 140 



Thr Lys Ala He Phe Phe Glu Ser Leu Ser Asn Pro Gin He Ala He 
145 150 155 160 



Ala Asp He Glu Lys He Asn Gin He Ala Lys Lys His Lys He Val 
165 170 175 



Ser He Cys Asp Asn Thr Val Ala Thr Pro Phe Leu Leu Gin Pro Phe 
180 185 190 



Lys His Gly Val Asp Val He Val His Ser Leu Ser Lys Tyr Val Ser 
195 200 205 



Gly Gin Gly Thr Ala Leu Gly Gly Ala Leu He Glu Arg Lys Asp Leu 
210 215 220 



Asn Asp Leu Leu Lys Asn Asn Asp Arg Tyr Lys Ala Phe Asn Thr Pro 
225 230 235 240 



Asp Pro Ser Tyr His Gly Leu Asn Leu Asn Thr Leu Asp Leu Pro He 
245 250 255 



Phe Ser He Arg Val He He Thr Trp Leu Arg Asp Leu Gly Ala Ser 
260 265 270 



Leu Ala Pro Gin Asn Ala Trp Leu Leu Leu Gin Gly Leu Glu Thr Leu 
275 * 280 285 



Ala Val Arg He Glu Lys His Ser Gin Asn Ala Glu Lys Val Ala Asn 
290 295 300 



* 
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Phe Leu Asn Ser His Pro Asp He Lys Gly Val Asn Tyr Pro Thr Leu 
305 310 315 320 



Ala Ser Asn Ala Tyr His Asn Leu Phe Lys Lys Tyr Phe Asp Lys Asn 
325 330 335 



Phe Ala Ser Gly Leu Leu Ser Phe Glu Ala Lys Asp Tyr Glu His Ala 
340 345 350 



Arg Arg lie Cys Asp Lys Thr Gin Leu Phe Leu Leu Ala Ala Asn Leu 
355 360 365 



Gly Asp Ser Lys Ser Leu He He His Pro Ala Ser Thr Thr His Ser 
370 375 380 



Gin Leu Ser Glu Glu Glu Leu Gin Lys Ala Gly He Thr Lys Ala Thr 
385 390 395 400 



He Arg Leu Ser He Gly Leu Glu Asn Ser Asp Asp Leu He Ala Asp 
405 410 415 



Leu Lys Gin Ala He Glu Ser 
420 



<210> 45 

<211> 1041 

<212> DNA 

<213> Streptococcus pneumoniae 
<220> 

<221> COS 

<222> (1)..(1041) 

<223> 



<400> 45 

ttg agg aaa cca ggg aac att tat act cgt ate acc aat cct aca aca 4 8 

Leu Arg Lys Pro Gly Asn He Tyr Thr Arg He Thr Asn Pro Thr Thr 
1 5 " 10 15 



get gee ctt gaa ggt ggt gtt gaa gcg eta gca aca gca tea ggt atg 
Ala Ala Leu Glu Gly Gly Val Glu Ala Leu Ala Thr Ala Ser Gly Met 
20 25 30 



96 
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act gca gtg act tat acg att ttg gcg att gcc cat get ggt gac cat 144 
Thr Ala Val Thr Tyr Thr He Leu Ala He Ala His Ala Gly Asp His 
35 40 45 

gta gtg get get teg act att tac ggt gga acc ttc aat ctt ttg aaa 192 
Val Val Ala Ala Ser Thr He Tyr Gly Gly Thr Phe Asn Leu Leu Lys 
50 55 60 

gaa ccc ctt cct cgt tat ggt ate aca aca acc ttt ttc gat att gat 240 
Glu Pro Leu Pro Arg Tyr Gly He Thr Thr Thr Phe Phe Asp He Asp 
65 70 75 80 

aat ttg gag gaa gta gaa gca get ate aaa gac aat acc aag ctt gtc 288 
Asn Leu Glu Glu Val Glu Ala Ala He Lys Asp Asn Thr Lys Leu Val 
85 90 95 

ttg att gaa acc ttg ggt aac ccc ttg att aat att cca gac ctg gaa 336 
Leu He Glu Thr Leu Gly Asn Pro Leu He Asn He Pro Asp Leu Glu 
100 105 110 

aaa ctg gca gag att get cat aaa cat caa ate cca ctt gtg tea gac 3 84 

Lys Leu Ala Glu He Ala His Lys His Gin He Pro Leu Val Ser Asp 
115 120 125 

aat act ttt gca aca cct tat ttg att aac gtc ttc tct cat ggc gtt 432 
Asn Thr Phe Ala Thr Pro Tyr Leu He Asn Val Phe Ser His Gly Val 
130 135 140 

gac att gcc att cac tct gtg act aag ttt ate ggt ggg cat ggt aca 480 
Asp He Ala He His Ser Val Thr Lys Phe He Gly Gly His Gly Thr 
145 150 155 160 

act att gga gga ata att gtc gat agt ggt cgt ttt gac tgg acg get 528 
Thr He Gly Gly He He Val Asp Ser Gly Arg Phe Asp Trp Thr Ala 
165 170 ~ 175 

tea ggg aaa ttc cct caa ttt gtt gac gag ggt cca age tgc cac aat 576 
Ser Gly Lys Phe Pro Gin Phe Val Asp Glu Gly Pro Ser Cys His Asn 
180 185 190 

ttg age tat act cgt gat gtg ggt gca gca gcc ttt att ata get gtt 624 
Leu Ser Tyr Thr Arg Asp Val Gly Ala Ala Ala Phe He He Ala Val 
195 200 205 

cga gtt caa ttg ctt cgt gat aca ggt gca gcc ttg tea cca ttc aat 672 
Arg Val Gin Leu Leu Arg Asp Thr Gly Ala Ala Leu Ser Pro Phe Asn 
210 215 220 

get ttc etc ttg eta caa aga ctt gaa acc tct tea ctt cgt gtg gaa 720 
Ala Phe Leu Leu Leu Gin Arg Leu Glu Thr Ser Ser Leu Arg Val Glu 
225 230 235 ^ 240 

cgc cat gta caa aat get gag aca att gtt gat ttt ctt gtc aac cat 768 
Arg His Val Gin Asn Ala Glu Thr He Val Asp Phe Leu Val Asn His 
245 250 255 

cct aag gta gaa aag gta aat tat cca aaa ctt gca gat agt cct tat 816 
Pro Lys Val Glu Lys Val Asn Tyr Pro Lys Leu Ala Asp Ser Pro Tyr 
260 265 270 

cat gcc ttg get gag aaa tac ttg cca aaa ggt gtc ggt tea ate ttt 864 
His Ala Leu Ala Glu Lys Tyr Leu Pro Lys Gly Val Gly Ser He Phe 
275 280 285 
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acc ttc cac gtc aaa ggt ggc gag gaa gaa gca cgc aag gtc att gat 912 
Thr Phe His Val Lys Gly Gly Glu Glu Glu Ala Arg Lys Val lie Asp 
290 295 300 

aat tta gaa ate ttt tct gac ctt gca aac gcg gca gat get aaa tcg« 960 
Asn Leu Glu He Phe Ser Asp Leu Ala Asn Ala Ala Asp Ala Lys Ser 
305 310 315 320 

ctt gtt gtc cat cca gca aca acc act cac ggt caa ttg tea gaa aaa 1008 
Leu Val Val His Pro Ala Thr Thr Thr His Gly Gin Leu Ser Glu Lys 
325 330 335 

gac eta gaa gca gca ggt gtc aca cca aac taa 1041 
Asp Leu Glu Ala Ala Gly Val Thr Pro Asn 
340 345 

<210> 46 
<211> 346 
<212> PRT 

<213> Streptococcus pneumoniae 



<400> 46 

Leu Arg Lys Pro Gly Asn He Tyr Thr Arg He Thr Asn Pro Thr Thr 
15 10 15 



Ala Ala Leu Glu Gly Gly Val Glu Ala Leu Ala Thr Ala Ser Gly Met 
20 25 30 



Thr Ala Val Thr Tyr Thr He Leu Ala He Ala His Ala Gly Asp His 
35 40 45 



Val Val Ala Ala Ser Thr He Tyr Gly Gly Thr Phe Asn Leu Leu Lys 
50 55 60 



Glu Pro Leu Pro Arg Tyr Gly He Thr Thr Thr Phe Phe Asp He Asp 
65 70 75 80 



Asn Leu Glu Glu Val Glu Ala Ala He Lys Asp Asn Thr Lys Leu Val 
85 90 95 



Leu He Glu Thr Leu Gly Asn Pro Leu He Asn He Pro Asp Leu Glu 
100 105 110 



Lys Leu Ala Glu He Ala His Lys His Gin He Pro Leu Val Ser Asp 
115 120 125 



Asn Thr Phe Ala Thr Pro Tyr Leu He Asn Val Phe Ser His Gly Val 
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Asp lie Ala lie His Ser Val Thr Lys Phe lie Gly Gly His Gly Thr 
145 150 155 160 

Thr He Gly Gly He He Val Asp Ser Gly Arg Phe Asp Trp Thr Ala 
165 170 175 

Ser Gly Lys Phe Pro Gin Phe Val Asp Glu Gly Pro Ser Cys His Asn 
180 185 190 

Leu Ser Tyr Thr Arg Asp Val Gly Ala Ala Ala Phe He He Ala Val 
195 200 205 

Arg Val Gin Leu Leu Arg Asp Thr Gly Ala Ala Leu Ser Pro Phe Asn 
210 215 .220 

Ala Phe Leu Leu Leu Gin Arg Leu Glu Thr Ser Ser Leu Arg Val Glu 
225 230 235 240 

Arg His Val Gin Asn Ala Glu Thr He Val Asp Phe Leu Val Asn His 
245 250 255 

Pro Lys Val Glu Lys Val Asn Tyr Pro Lys Leu Ala Asp Ser Pro Tyr 
260 265 270 

His Ala Leu Ala Glu Lys Tyr Leu Pro Lys Gly Val Gly Ser He Phe 
275 280 285 

Thr Phe His Val Lys Gly Gly Glu Glu Glu Ala Arg Lys Val He Asp 
290 295 300 

Asn Leu Glu He Phe Ser Asp Leu Ala Asn Ala Ala Asp Ala Lys Ser 
305 310 315 " 320 

Leu Val Val His Pro Ala Thr Thr Thr His Gly Gin Leu Ser Glu Lys 
325 330 335 

Asp Leu Glu Ala Ala Gly Val Thr Pro Asn 
340 345 

<210> 47 
<211> 1335 
<212> DNA 

<213:> Saccharomyces cerevisiae 
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<220> 

<221> CDS 

<222> (1)..(1335) 

<223> 



<400> 47 

atg cca tct cat ttc gat act gtt caa eta cac gec ggc caa gag aac 48 
Met Pro Ser His Phe Asp Thr Val Gin Leu His Ala Gly Gin Glu Asn 
15 10 15 

cct ggt gac aat get cac aga tec aga get gta cca att tac gee acc 96 
Pro Gly Asp Asn Ala His Arg Ser Arg Ala Val Pro lie Tyr Ala Thr 
20 25 30 

act tct tat gtt ttc gaa aac tct aag cat ggt teg caa ttg ttt ggt 144 
Thr Ser Tyr Val Phe Glu Asn Ser Lys His Gly Ser Gin Leu Phe Gly 
35 40 45 

eta gaa gtt cca ggt tac gtc tat tec cgt ttc caa aac cca acc agt 192 
Leu Glu Val Pro Gly Tyr Val Tyr Ser Arg Phe Gin Asn Pro Thr Ser 
50 55 60 

aat gtt ttg gaa gaa aga att get get tta gaa ggt ggt get get get 240 
Asn Val Leu Glu Glu Arg lie Ala Ala Leu Glu Gly Gly Ala Ala Ala 
65 70 75 80 

ttg get gtt tec tec ggt caa gee get caa acc ctt gee ate caa ggt 288 
Leu Ala Val Ser Ser Gly Gin Ala Ala Gin Thr Leu Ala He Gin Gly 
85 90 95 

ttg gca cac act ggt gac aac ate gtt tec act tct tac tta tac ggt 336 
Leu Ala His Thr Gly Asp Asn He Val Ser Thr Ser Tyr Leu Tyr Gly 
100 105 110 

ggt act tat aac cag ttc aaa ate teg ttc aaa aga ttt ggt ate gag 384 
Gly Thr Tyr Asn Gin Phe Lys He Ser Phe Lys Arg Phe Gly He Glu 
115 120 125 

get aga ttt gtt gaa ggt gac aat cca gaa gaa ttc gaa aag gtc ttt 432 
Ala Arg Phe Val Glu Gly Asp Asn Pro Glu Glu Phe Glu Lys Val Phe 
130 135 140 



gat gaa aga acc aag get gtt tat ttg gaa acc att ggt aat cca aag 
Asp Glu Arg Thr Lys Ala Val Tyr Leu Glu Thr He Gly Asn Pro Lys 
145 150 155 160 



tgt cag cca att aaa tac ggt get gat att gta aca cat tct get acc 
Cys Gin Pro He Lys Tyr Gly Ala Asp He Val Thr His Ser Ala Thr 



480 



tac aat gtt ccg gat ttt gaa aaa att gtt gca att get cac aaa cac 528 

Tyr Asn Val Pro Asp Phe Glu Lys He Val Ala He Ala His Lys His 
165 170 175 

ggt att cca gtt gtc gtt gac aac aca ttt ggt gec ggt ggt tac ttc 576 

Gly He Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Tyr Phe 
180 185 190 



624 
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195 200 205 

aaa tgg att ggt ggt cat ggt act act ate ggt ggt att att gtt gac 672 
Lys Trp He Gly Gly His Gly Thr Thr He Gly Gly He He Val Asp 
210 215 220 

tct ggt aag ttc cca tgg aag gac tac cca gaa aag ttc cct caa ttc 720 
Ser Gly Lys Phe Pro Trp Lys Asp Tyr Pro Glu Lys Phe Pro Gin Phe 
225 230 235 240 

tct caa cct gec gaa gga tat cac ggt act ate tac aat gaa gec tac 768 
Ser Gin Pro Ala Glu Gly Tyr His Gly Thr He Tyr Asn Glu Ala Tyr 
245 - 250 255 

ggt aac ttg gca tac ate gtt cat gtt aga act gaa eta tta aga gat 816 
Gly Asn Leu Ala Tyr He Val His Val Arg Thr Glu Leu Leu Arg Asp 
260 265 270 

ttg ggt cca ttg atg aac cca ttt gec tct ttc ttg eta eta caa ggt 864 
Leu Gly Pro Leu Met Asn Pro Phe Ala Ser Phe Leu Leu Leu Gin Gly 
275 280 285 

gtt gaa aca tta tct ttg aga get gaa aga cac ggt gaa aat gca ttg 912 
Val Glu Thr Leu Ser Leu Arg Ala Glu Arg His Gly Glu Asn Ala Leu 
290 295 300 

aag tta gec aaa tgg tta gaa caa tec cca tac gta tct tgg gtt tea 960 
Lys Leu Ala Lys Trp Leu Glu Gin Ser Pro Tyr Val Ser Trp Val Ser 
305 310 315 320 

tac cct ggt tta gca tct cat tct cat cat gaa aat get aag aag tat 1008 
Tyr Pro Gly Leu Ala Ser His Ser His His Glu Asn Ala Lys Lys Tyr 
325 330 335 

eta tct aac ggt ttc ggt ggt gtc tta tct ttc ggt gta aaa gac tta 1056 
Leu Ser Asn Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys Asp Leu 
340 345 350 

cca aat gec gac aag gaa act gac cca ttc aaa ctt tct ggt get caa 1104 
Pro Asn Ala Asp Lys Glu Thr Asp Pro Phe Lys lieu Ser Gly Ala Gin 
355 360 365 

gtt gtt gac aat tta aag ctt gee tct aac ttg gec aat gtt ggt gat 1152 
Val Val Asp Asn Leu Lys Leu Ala Ser Asn Leu Ala Asn Val Gly Asp 
370 375 380 

gec aag acc tta gtc att get cca tac ttc act ace cac aaa caa tta 1200 
Ala Lys Thr Leu Val He Ala Pro Tyr Phe Thr Thr His Lys Gin Leu 
385 390 395 400 

aat gac aaa gaa aag ttg gca tct ggt gtt acc aag gac tta att cgt 1248 
Asn Asp Lys Glu Lys Leu Ala Ser Gly Val Thr Lys Asp Leu He Arg 
405 410 415 

gtc tct gtt ggt ate gaa ttt att gat gac att att gca gac ttc cag 1296 
Val Ser Val Gly He Glu Phe He Asp Asp He He Ala Asp Phe Gin 
420 425 430 



caa tct ttt gaa act gtt ttc get ggc caa aaa cca tga 1335 
Gin Ser Phe Glu Thr Val Phe Ala Gly Gin Lys Pro 
435 440 
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<210> 48 
<211> 444 
<212> PRT 

<213> Saccharomyces cerevisiae 
<400> 48 

Met Pro Ser His Phe Asp Thr Val Gin Leu His Ala Gly Gin Glu Asn 
15 10 15 

Pro Gly Asp Asn Ala His Arg Ser Arg Ala Val Pro lie Tyr Ala Thr 
20 25 30 

Thr Ser Tyr Val Phe Glu Asn Ser Lys His Gly Ser Gin Leu Phe Gly 
35 40 45 

Leu Glu Val Pro Gly Tyr Val Tyr Ser Arg Phe Gin Asn Pro Thr Ser 
50 55 60 

Asn Val Leu Glu Glu Arg Xle Ala Ala Leu Glu Gly Gly Ala Ala Ala 
65 70 75 80 

Leu Ala Val Ser Ser Gly Gin Ala Ala Gin Thr Leu Ala lie Gin Gly 
85 90 95 

Leu Ala His Thr Gly Asp Asn lie Val Ser Thr Ser Tyr Leu Tyr Gly 
100 105 110 

Gly Thr Tyr Asn Gin Phe Lys He Ser Phe Lys Arg Phe Gly He Glu 
115 120 125 

Ala Arg Phe Val Glu Gly Asp Asn Pro Glu Glu Phe Glu Lys Val Phe 
130 135 140 

Asp Glu Arg Thr Lys Ala Val Tyr Leu Glu Thr He Gly Asn Pro Lys 
145 150 155 160 

Tyr Asn Val Pro Asp Phe Glu Lys He Val Ala He Ala His Lys His 
165 170 175 

Gly He Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Tyr Phe 
180 185 190 



Cys Gin Pro He Lys Tyr Gly Ala Asp He Val Thr His Ser Ala Thr 
195 200 205 
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Lys Trp lie Gly Gly His Gly Thr Thr lie Gly Gly He He Val Asp 
210 215 220 

Ser Gly Lys Phe Pro Trp Lys Asp Tyr Pro Glu Lys Phe Pro Gin Phe 
225 230 235 240 

Ser Gin Pro Ala Glu Gly Tyr His Gly Thr He Tyr Asn Glu Ala Tyr 
245 250 255 

Gly Asn Leu Ala Tyr He Val His Val Arg Thr Glu Leu Leu Arg Asp 
260 265 270 

Leu Gly Pro Leu Met Asn Pro Phe Ala Ser Phe Leu Leu Leu Gin Gly 
275 280 285 

Val Glu Thr Leu Ser Leu Arg Ala Glu Arg His Gly Glu Asn Ala Leu 
290 295 300 

Lys Leu Ala Lys Trp Leu Glu Gin Ser Pro Tyr Val Ser Trp Val Ser 
305 310 315 320 

Tyr Pro Gly Leu Ala Ser His Ser His His Glu Asn Ala Lys Lys Tyr 
325 330 335 

Leu Ser Asn Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys Asp Leu 
34 0 345 350 

Pro Asn Ala Asp Lys Glu Thr Asp Pro Phe Lys Leu Ser Gly Ala Gin 
355 360 365 

Val Val Asp Asn Leu Lys Leu Ala Ser Asn Leu Ala Asn Val Gly Asp 
370 375 380 

Ala Lys Thr Leu Val He Ala Pro Tyr Phe Thr Thr His Lys Gin Leu 
385 390 395 ~ 400 

Asn Asp Lys Glu Lys Leu Ala Ser Gly Val Thr Lys Asp Leu He Arg 
405 410 415 

Val Ser Val Gly He Glu Phe He Asp Asp He He Ala Asp Phe Gin 
420 425 430 

Gin Ser Phe Glu Thr Val Phe Ala Gly Gin Lys Pro 
435 440 



<210> 49 
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<211> 1335 
<212> DNA 

<213> Kluyverorayces lactis 



<220> 

<221> CDS 

<222> (1) . . (1335) 

<223> 



<400> 49 

atg cca tct cac ttc gat act ttg caa ttg cac get ggt caa gaa aag 48 

Met Pro Ser His Phe Asp Thr Leu Gin Leu His Ala Gly Gin Glu Lys 

15 10 15 

act get gat get cat aac cca aga gec gtc cca att tac get acc act 96 
Thr Ala Asp Ala His Asn Pro Arg Ala Val Pro lie Tyr Ala Thr Thr 
20 25 30 

tct tac gtc ttc aac gac tct aag cat ggt get caa ttg ttc ggt tta 144 
Ser Tyr Val Phe Asn Asp Ser Lys His Gly Ala Gin Leu Phe Gly Leu 
35 40 45 

gaa act cca ggt tac att tac tct cgt att atg aac cct act eta gac 192 
Glu Thr Pro Gly Tyr lie Tyr Ser Arg lie Met Asn Pro Thr Leu Asp 
50 55 60 

gtc ttg gaa aag aga ttg gca gec tta gaa ggt ggt att get get ttg 240 
Val Leu Glu Lys Arg Leu Ala Ala Leu Glu Gly Gly lie Ala Ala Leu 
65 70 75 80 

get act tct tct ggc caa get get caa acc ttg get gtc act ggt ttg 288 
Ala Thr Ser Ser Gly Gin Ala Ala Gin Thr Leu Ala Val Thr Gly Leu 
85 90 95 

gec cac act ggt gac aat att gtc tct acc tct ttc tta tac ggt ggt 336 
Ala His Thr Gly Asp Asn lie Val Ser Thr Ser Phe Leu Tyr Gly Gly 
100 105 110 

act tat aac caa ttc aag gtt gec ttc aag aga tta gga att gaa get 384 
Thr Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly lie Glu Ala 
115 120 125 

aga ttt gtc gat ggt gac aag cca gaa gac ttc gaa aag ttg ttc gat 432 
Arg Phe Val Asp Gly Asp Lys Pro Glu Asp Phe Glu Lys Leu Phe Asp 
130 135 140 

gaa aag act aag get etc tat ctg gaa tct ate ggt aat cct aag tac 480 
Glu Lys Thr Lys Ala Leu Tyr Leu Glu Ser lie Gly Asn Pro Lys Tyr 
145 150 155 160 

aat gtc cca gac ttc gaa aag att gtt get gtt get cat aag cat ggt 528 
Asn Val Pro Asp Phe Glu Lys lie Val Ala Val Ala His Lys His Gly 
165 170 175 
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ate cca gtt gtt gtt gac aac act ttc ggt gec ggt ggt ttc ttc tgc 576 
lie Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Phe Phe Cys 
180 185 190 

caa cct ate aaa tac ggt get gat ate gtt act cac tct get ace aag 624 
Gin Pro lie Lys Tyr Gly Ala Asp lie Val Thr His Ser Ala Thr Lys 
195 200 205 

tgg ate ggt ggt cat ggt gtc ace gtt ggt ggt gtc ate att gac tct 672 
Trp He Gly Gly His Gly Val Thr Val Gly Gly Val He He Asp Ser 
210 215 220 

ggt aag ttc cca tgg aag gat tac ccg gaa aag ttc cct caa ttc tct 720 
Gly Lys Phe Pro Trp Lys Asp Tyr Pro Glu Lys Phe Pro Gin Phe Ser 
225 230 235 240 

cag cca tct gaa ggt tat cat ggt ttg ate ttc aat gat gee ttt ggt 768 
Gin Pro Ser Glu Gly Tyr His Gly Leu He Phe Asn Asp Ala Phe Gly 
245 250 255 

cca get get ttc att ggt cat gta aga ace gaa ttg eta aga gat tta 816 
Pro Ala Ala Phe He Gly His Val Arg Thr Glu Leu Leu Arg Asp Leu 
260 265 270 

ggt cca gtg ttg agt cca ttc get ggt ttc ttg ttg tta cag ggt ctt 864 
Gly Pro Val Leu Ser Pro Phe Ala Gly Phe Leu Leu Leu Gin Gly Leu 
275 280 285 

gaa act ttg tct eta aga ggt gaa aga cac ggt tec aac get ttg aag 912 
Glu Thr Leu Ser Leu Arg Gly Glu Arg His Gly Ser Asn Ala Leu Lys 
290 295 300 

ttg get caa tac ttg gaa agt tct cca tac gtt tea tgg gtc tct tac 960 
Leu Ala Gin Tyr Leu Glu Ser Ser Pro Tyr Val Ser Trp Val Ser Tyr 
305 310 315 320 

cca ggt ttg cca tct cac tct cac cac gaa aac get aag aaa tac ttg 1008 
Pro Gly Leu Pro Ser His Ser His His Glu Asn Ala Lys Lys Tyr Leu 
325 330 335 

gaa aat ggt ttc ggt ggt gtt tta tec ttc ggt gtc aaa gat ttg cct 1056 
Glu Asn Gly Phe Gly Gly Val lieu Ser Phe Gly Val Lys Asp Leu Pro 
340 345 350 

aac get tec gag gaa tct gat cca ttc aag get tct ggt gee caa gtt 1104 
Asn Ala Ser Glu Glu Ser Asp Pro Phe Lys Ala Ser Gly Ala Gin Val 
355 360 365 

gtt gac aac ttg aag ctg get tct aac ttg gca aac gtt ggt gac tec 1152 
Val Asp Asn Leu Lys Leu Ala Ser Asn Leu Ala Asn Val Gly Asp Ser 
370 375 380 

aag ace ttg gtc att get cca tac ttc act aca cat caa caa ttg ace 1200 
Lys Thr Leu Val He Ala Pro Tyr Phe Thr Thr His Gin Gin Leu Thr 
385 390 395 400 

gac gaa gaa aag tta get tct ggt gtt ace aag gac ttg ate cgt gtt 1248 
Asp Glu Glu Lys Leu Ala Ser Gly Val Thr Lys Asp Leu He Arg Val 
405 410 415 

tct gtt ggt act gaa ttc att gac gac att att get gac ttt gaa gca 1296 
Ser Val Gly Thr Glu Phe He Asp Asp He He Ala Asp Phe Glu Ala 
420 425 430 
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tct ttc get act gfcc ttc aat ggc caa aaa cct gaa taa 1335 
Ser Phe Ala Thr Val Phe Asn Gly Gin Lys Pro Glu 
435 440 

<210> 50 

<211> 444 

<212> PRT 

<213> Kluyveromyces lactis 



<400> 50 

Met Pro Ser His Phe Asp Thr Leu Gin Leu His Ala Gly Gin Glu Lys 
1 5 10 15 

Thr Ala Asp Ala His Asn Pro Arg Ala Val Pro lie Tyr Ala Thr Thr 
20 25 30 

Ser Tyr Val Phe Asn Asp Ser Lys His Gly Ala Gin lieu Phe Gly Leu 
35 40 45 

Glu Thr Pro Gly Tyr lie Tyr Ser Arg lie Met Asn Pro Thr Leu Asp 
50 55 60 

Val Leu Glu Lys Arg Leu Ala Ala Leu Glu Gly Gly lie Ala Ala Leu 
65 70 75 80 

Ala Thr Ser Ser Gly Gin Ala Ala Gin Thr Leu Ala Val Thr Gly Leu 
85 90 95 

Ala His Thr Gly Asp Asn lie Val Ser Thr Ser Phe Leu Tyr Gly Gly 
100 105 110 

Thr Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly lie Glu Ala 
115 120 125 

Arg Phe Val Asp Gly Asp Lys Pro Glu Asp Phe Glu Lys Leu Phe Asp 
130 135 140 

Glu Lys Thr Lys Ala Leu Tyr Leu Glu Ser lie Gly Asn Pro Lys Tyr 
1« ISO 155 160 

Asn Val Pro Asp Phe Glu Lys lie Val Ala Val Ala His Lys His Gly 
165 170 175 



lie Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Phe Phe Cys 
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180 185 190 

Gin Pro He Lys Tyr Gly Ala Asp He Val Thr His Ser Ala Thr Lys 
195 200 205 

Trp He Gly Gly His Gly Val Thr Val Gly Gly Val He He Asp Ser 
210 215 220 

Gly Lys Phe Pro Trp Lys Asp Tyr Pro Glu Lys Phe Pro Gin Phe Ser 
225 230 235 240 

Gin Pro Ser Glu Gly Tyr His Gly Leu He Phe Asn Asp Ala Phe Gly 
245 250 255 

Pro Ala Ala Phe He Gly His Val Arg Thr Glu Leu Leu Arg Asp Leu 
260 265 270 

Gly Pro Val Leu Ser Pro Phe Ala Gly Phe Leu Leu Leu Gin Gly Leu 
275 280 285 

Glu Thr Leu Ser Leu Arg Gly Glu Arg His Gly Ser Asn Ala Leu Lys 
290 295 • 300 

Leu Ala Gin Tyr Leu Glu Ser Ser Pro Tyr Val Ser Trp Val Ser Tyr 
305 310 315 320 

Pro Gly Leu Pro Ser His Ser His His Glu Asn Ala Lys Lys Tyr Leu 
325 330 335 

Glu Asn Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys Asp Leu Pro 
340 345 350 

Asn Ala Ser Glu Glu Ser Asp Pro Phe Lys Ala Ser Gly Ala Gin Val 
355 360 365 

Val Asp Asn Leu Lys Leu Ala Ser Asn Leu Ala Asn Val Gly Asp Ser 
370 375 380 

Lys Thr Leu Val He Ala Pro Tyr Phe Thr Thr His Gin Gin Leu Thr 
385 390 395 400 

Asp Glu Glu Lys Leu Ala Ser Gly Val Thr Lys Asp Leu He Arg Val 
405 410 415 



Ser Val Gly Thr Glu Phe He Asp Asp He He Ala Asp Phe Glu Ala 
420 425 430 
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Ser Phe Ala Thr Val Phe Asn Gly Gin Lys Pro Glu 
435 440 

<210> 51 

<211> 1323 

<212> DMA 

<213> Candida albicans 



<220> 

<221> CDS 

<222> (1) . . (1323) 

<223> 



<400> 51 

atg cct tct cac ttt gat aca ctt caa tta cat get ggt caa cca gtt 48 

Met Pro Ser His Phe Asp Thr Leu Gin lieu His Ala Gly Gin Pro Val 

1 5 10 15 

gaa aaa cca cac caa cca aga gec cca cca att tat gca acc acc tec 96 
Glu Lys Pro His Gin Pro Arg Ala Pro Pro lie Tyr Ala Thr Thr Ser 
20 25 30 

tat gtt ttc aat gac tct aaa cac ggt get caa tta ttt ggt tta gaa 144 
Tyr Val Phe Asn Asp Ser Lys His Gly Ala Gin Leu Phe Gly Leu Glu 
35 40 45 

acc cca gga tac att tac tec aga att atg aat cca aca aac gat gtg 192 
Thr Pro Gly Tyr lie Tyr Ser Arg He Met Asn Pro Thr Asn Asp Val 
50 55 60 

ttt gaa caa aga att get gee ttg gaa ggt ggt att ggt gca ttg gec 240 
Phe Glu Gin Arg lie Ala Ala Leu Glu Gly Gly He Gly Ala Leu Ala 
65 70 75 80 

act tct tct ggt caa tea get caa ttc ttg gee att get ggg ttg get 288 
Thr Ser Ser Gly Gin Ser Ala Gin Phe Leu Ala He Ala Gly Leu Ala 
85 90 95 

cat get ggt gat aac att ate agt aca tec tac ttg tat ggt ggt act 336 
His Ala Gly Asp Asn He He Ser Thr Ser Tyr Leu Tyr Gly Gly Thr 
100 105 110 

tat aat caa ttc aaa gtt get ttc aaa cgt ttg ggc att gaa acc aaa 3 84 

Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly He Glu Thr Lys 
115 120 125 

ttc gtt aat ggt gac gee get gaa gat ttt get aaa ttg att gac gac 432 
Phe Val Asn Gly Asp Ala Ala Glu Asp Phe Ala Lys Leu He Asp Asp 
130 135 140 

aag aca aaa get att tat att gaa acc att gga aac cct aaa tat aat 480 
Lys Thr Lys Ala He Tyr He Glu Thr He Gly Asn Pro Lys Tyr Asn 
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145 150 155 160 

gtt ccg gac ttt gaa aaa ate acc aaa ttg gec cat gaa cac ggt att 528 
Val Pro Asp Phe Glu Lys lie Thr Lya Leu Ala His Qlu His Gly He 
165 170 175 

cct gtt gtt gtc gac aac act ttt ggt get ggt gga ttt tta gtt aac 576 
Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Phe Leu Val Asn 
180 185 190 

cca att gee cac ggt get gat att gtt gtt cat tct get act aaa tgg 624 
Pro He Ala His Gly Ala Asp He Val Val His Ser Ala Thr Lys Trp 
195 200 205 

att ggt ggt cac ggt act aca att get ggt gtt att gtt gat tec ggt 672 
He Gly Gly His Gly Thr Thr He Ala Gly Val He Val Asp Ser Gly 
210 215 220 

aac ttc cca tgg acc gag tac cca gaa aaa tac cca caa ttc tct aaa 720 
Asn Phe Pro Trp Thr Glu Tyr Pro Glu Lys Tyr Pro Gin Phe Ser Lys 
225 230 235 240 

cca tea gaa ggt tac cac ggg ttg ate ttg aat gat get tta ggt aag 768 
Pro Ser Glu Gly Tyr His Gly Leu He Leu Asn Asp Ala Leu Gly Lys 
245 250 255 

gec gca tac att ggt cac ttg aga att gaa ttg ttg aga gac ttg ggt 816 
Ala Ala Tyr He Gly His Leu Arg He Glu Leu Leu Arg Asp Leu Gly 
260 265 270 

cca get ttg aat cca ttt gga agt ttt ttg ttg ttg caa ggt tta gaa 864 
Pro Ala Leu Asn Pro Phe Gly Ser Phe Leu Leu Leu Gin Gly Leu Glu 
275 280 265 

act ttg tct ttg aga gtt gaa aga caa tct gaa aat get ttg aaa ttg 912 
Thr Leu Ser Leu Arg Val Glu Arg Gin Ser Glu Asn Ala Leu Lys Leu 
290 295 300 

gec caa tgg ttg gaa aag aac cca aat gtt gag tct gtg tec tat ttg 960 
Ala Gin Trp Leu Glu Lys Asn Pro Asn Val Glu Ser Val Ser Tyr Leu 
305 310 315 320 

gga ttg cca tct cac gaa tec cac gaa ttg agt aaa aaa tac ttg aac 1008 
Gly Leu Pro Ser His, Glu Ser His Glu Leu Ser Lys Lys Tyr Leu Asn 
325 330 335 

aat gac get aag tac ttt ggt ggt get tta gca ttt act gtc aag gac 1056 
Asn Asp Ala Lys Tyr Phe Gly Gly Ala Leu Ala Phe Thr Val Lys Asp 
340 345 350 

ate acc aac acc tec age gac cca ttc aat gaa gee tea cca aag ttg 1104 
He Thr Asn Thr Ser Ser Asp Pro Phe Asn Glu Ala Ser Pro Lys Leu 
355 360 365 

gtt gac aat ttg gag att get tea aac ttg get aat gtg ggt gac tct 1152 
Val Asp Asn Leu Glu He Ala Ser Asn Leu Ala Asn Val Gly Asp Ser 
370 375 380 

aag act ttg gtt att get cca tgg ttt act aca cat caa caa ttg tct 1200 
Lys Thr Leu Val He Ala Pro Trp Phe Thr Thr His Gin Gin Leu Ser 
385 390 395 400 

gat gaa gaa aag ttg get tct ggt gtt acc aag ggc tta ate aga gtt 1248 
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Asp Glu Glu Lys Leu Ala Ser Gly Val Thr Lys Gly lieu lie Arg Val 
405 410 415 

tct act ggt act gaa tat att gat gat att att aac gac ttt gaa caa 1296 
Ser Thr Gly Thr Glu Tyr lie Asp Asp lie lie Asn Asp Phe Glu Gin 
420 425 430 

gca ttc aag aag gtt tat aac aac taa 1323 
Ala Phe Lys Lys Val Tyr Asn Asn 
435 440 

<210> 52 

<211> 440 

<212> PRT 

<213> Candida albicans 



<400> 52 

Met Pro Ser His Phe Asp Thr Leu Gin Leu His Ala Gly Gin Pro Val 
15 10 15 



Glu Lys Pro His Gin Pro Arg Ala Pro Pro lie Tyr Ala Thr Thr Ser 
20 25 30 



Tyr Val Phe Asn Asp Ser Lys His Gly Ala Gin Leu Phe Gly Leu Glu 
35 40 45 



Thr Pro Gly Tyr lie Tyr Ser Arg lie Met Asn Pro Thr Asn Asp Val 
50 55 60 



Phe Glu Gin Arg lie Ala Ala Leu Glu Gly Gly lie Gly Ala Leu Ala 
65 70 75 80 



Thr Ser Ser Gly Gin Ser Ala Gin Phe Leu Ala lie Ala Gly Leu Ala 
85 90 95 



His Ala Gly Asp Asn lie lie Ser Thr Ser Tyr Leu Tyr Gly Gly Thr 
100 105 110 



Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly lie Glu Thr Lys 
115 120 125 



Phe Val Asn Gly Asp Ala Ala Glu Asp Phe Ala Lys Leu lie Asp Asp 
130 135 140 



Lys Thr Lys Ala lie Tyr lie Glu Thr lie Gly Asn Pro Lys Tyr Asn 
145 150 155 160 
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Val Pro Asp Phe Glu Lys lie Thr Lys Leu Ala His Glu His Gly lie 
165 170 175 



Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Phe lieu Val Asn 
180 185 190 



Pro He Ala His Gly Ala Asp He Val Val His Ser Ala Thr Lys Trp 
195 200 205 



He Gly Gly His Gly Thr Thr He Ala Gly Val He Val Asp Ser Gly 
210 215 220 



Asn Phe Pro Trp Thr Glu Tyr Pro Glu Lys Tyr Pro Gin Phe Ser Lys 
225 230 235 240 



Pro Ser Glu Gly Tyr His Gly Leu He Leu Asn Asp Ala Leu Gly Lys 
245 250 255 

Ala Ala Tyr He Gly His Leu Arg He Glu Leu Leu Arg Asp Leu Gly 
260 265 270 



Pro Ala Leu Asn Pro Phe Gly Ser Phe Leu Leu Leu Gin Gly Leu Glu 
275 280 285 



Thr Leu Ser Leu Arg Val Glu Arg Gin Ser Glu Asn Ala Leu Lys Leu 
290 295 300 



Ala Gin Trp Leu Glu Lys Asn Pro Asn Val Glu Ser Val Ser Tyr Leu 
305 310 315 320 



Gly Leu Pro Ser His Glu Ser His Glu Leu Ser Lys Lys Tyr Leu Asn 
325 330 335 



Asn Asp Ala Lys Tyr Phe Gly Gly Ala Leu Ala Phe Thr Val Lys Asp 
340 345 350 



He Thr Asn Thr Ser Ser Asp Pro Phe Asn Glu Ala Ser Pro Lys Leu 
355 360 365 



Val Asp Asn Leu Glu He Ala Ser Asn Leu Ala Asn Val Gly Asp Ser 
370 375 380 



Lys Thr Leu Val He Ala Pro Trp Phe Thr Thr His Gin Gin Leu Ser 
385 390 395 400 



Asp Glu Glu Lys Leu Ala Ser Gly Val Thr Lys Gly Leu He Arg Val 
405 410 415 
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Ser Thr Gly Tlir Glu Tyr lie Asp Asp lie lie Asn Asp Phe Glu Gin 
420 425 430 



Ala Phe Lys Lys Val Tyr Asn Asn 
435 440 

<210> 53 

<211> 1290 

<212> DNA 

<213> Schi zosaccharomyces pombe 
<220> 

<221> CDS 

<222> (1) . . (1290) 

<223> 



<400> 53 

atg cca gtc gag agt gaa cat: ttc gaa act tta caa tta cat get ggc 48 

Met Pro Val Glu Ser Glu His Phe Glu Thr Leu Gin Leu His Ala Gly 

1 5 10 15 

caa gag cct gat get get acc age tct cgt gec gtt ccc ate tac get 96 
Gin Glu Pro Asp Ala Ala Thr Ser Ser Arg Ala Val Pro He Tyr Ala 
20 25 30 

act act tec tat gtt ttc cgt gat tgc gac cat ggc ggc cgc ttg ttc 144 
Thr Thr Ser Tyr Val Phe Arg Asp Cys Asp His Gly Gly Arg Leu Phe 
35 40 45 

gga tta cag gaa cca ggt tac ate tac teg cgt atg atg aat ccc acc 192 
Gly Leu Gin Glu Pro Gly Tyr He Tyr Ser Arg Met Met Asn Pro Thr 
50 55 60 

gec gac gtt ttt gag aaa cgt att gee gee ttg gag cat ggc get get 240 
Ala Asp Val Phe Glu Lys Arg He Ala Ala Leu Glu His Gly Ala Ala 
65 70 75 ^ 80 

gca ate get act agt tec ggt act tec get etc ttc atg get ttg acc 288 
Ala He Ala Thr Ser Ser Gly Thr Ser Ala Leu Phe Met Ala Leu Thr 
85 90 95 

acg ttg get aag gee ggt gat aac att gtc tec act tct tac ctt tat 336 
Thr Leu Ala Lys Ala Gly Asp Asn He Val Ser Thr Ser Tyr Leu Tyr 
100 105 110 



ggt 99r fc act tac aac ctc tfc c aag gtt acc ctg cct aga ttg gga att 384 
Gly Gly Thr Tyr Asn Leu Phe Lys Val Thr Leu Pro Arg Leu Gly He 
115 120 125 
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act acc aag ttt gtc aat ggt gat gat cct aat gat ctt gca get cag 432 
Thr Thr Lys Phe Val Asn Gly Asp Asp Pro Asn Asp Leu Ala Ala Gin 
130 135 140 

att gat gaa aac aca aag get gtt tac gtt gag tec ate ggc aat ccc 480 
He Asp Glu Asn Thr Lys Ala Val Tyr Val Glu Ser He Gly Asn Pro 
145 150 155 160 

atg tac aac gtt ccc gat ttt gag cgt ate get gag gtt get cat gee 52 8 

Met Tyr Asn Val Pro Asp Phe Glu Arg He Ala Glu Val Ala His Ala 
165 170 175 

get ggt gtg cct tta atg gtc gat aac act ttt ggc ggc ggt ggt tat 576 
Ala Gly Val Pro Leu Met Val Asp Asn Thr Phe Gly Gly Gly Gly Tyr 
180 185 190 

ttg gtt cgt ccc att gac cac ggt gee gat ate gtt acc cac tct gee 624 
Leu Val Arg Pro lie Asp His Gly Ala Asp He Val Thr His Ser Ala 
195 200 205 

act aag tgg ate ggt ggt cat ggc act act att ggc ggt gtg att gtt 672 
Thr Lys Trp lie Gly Gly His Gly Thr Thr He Gly Gly Val He Val 
210 215 220 

gat agt ggt aag ttt gac tgg aag aag aac age aag cgt ttc cct gaa 720 
Asp Ser Gly Lys Phe Asp Trp Lys Lys Asn Ser Lys Arg Phe Pro Glu 
225 230 235 240 

ttc aac gag cct cat ccc ggt tac cat ggc atg gtc ttt act gaa act 768 
Phe Asn Glu Pro His Pro Gly Tyr His Gly Met Val Phe Thr Glu Thr 
245 250 255 

ttt ggt aac ttg gca tat get ttt get tgc cgt act caa act etc cgt 816 
Phe Gly Asn Leu Ala Tyr Ala Phe Ala Cys Arg Thr Gin Thr lieu Arg 
260 265 270 

gat gtt ggt ggc aat gee aat cca ttc ggt gtc ttt ttg ctt ctt caa 864 
Asp Val Gly Gly Asn Ala Asn Pro Phe Gly Val Phe Leu Leu Leu Gin 
275 280 285 

ggt ctt gaa acg ctt tct ctt cgt atg gag cgt cac gtt caa aat gca 912 
Gly Leu Glu Thr Leu Ser Leu Arg Met Glu Arg His Val Gin Asn Ala 
290 295 300 

ttt get ctt gca aaa tat ttg gaa aag cac ccc aag gtt aac tgg gtt 960 
Phe Ala Leu Ala Lys Tyr Leu Glu Lys His Pro Lys Val Asn Trp Val 
305 310 315 320 

tct tac cct ggt ctt gaa tct cac gtc tct cac aaa ctt gee aag aag 1008 
Ser Tyr Pro Gly Leu Glu Ser His Val Ser His Lys Leu Ala Lys Lys 
325 330 335 

tac ttg aaa aat ggt tac ggc gee gtt etc age ttt ggc get aaa ggt 1056 
Tyr Leu Lys Asn Gly Tyr Gly Ala Val Leu Ser Phe Gly Ala Lys Gly 
340 345 350 

ggc cct gat caa agt cgt aag gta gtc aat gee tta aag ctt get agt 1104 
Gly Pro Asp Gin Ser Arg Lys Val Val Asn Ala Leu Lys Leu Ala Ser 
355 360 365 

cag ttg gee aat gtt ggt gat gee aaa act ttg gtt ate get cct gee 1152 
Gin Leu Ala Asn Val Gly Asp Ala Lys Thr Leu Val He Ala Pro Ala 
370 375 380 
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tat acc act cat tta caa tta act gat gag gag caa att tct gcc ggt 1200 
Tyr Thr Thr His Leu Gin Leu Thr Asp Glu Glu Gin lie Ser Ala Gly 
385 390 395 400 

gtc act aag gat ctt att cgt gtg gcc gtc ggt att gag cac ate gat 1248 
Val Thr Lys Asp Leu lie Arg Val Ala Val Gly He Glu His He Asp 
405 410 415 

gat att ate gcc gac ttt get caa get ttg gaa gtt gcc taa 1290 
Asp He He Ala Asp Phe Ala Gin Ala Leu Glu Val Ala 
420 425 



<210> 54 
<211> 429 
<212> PRT 

<213> Schizosaccharorayces potnbe 
<400> 54 

Met Pro Val Glu Ser Glu His Phe Glu Thr Leu Gin Leu His Ala Gly 
15 10 15 



Gin Glu Pro Asp Ala Ala Thr Ser Ser Arg Ala Val Pro lie Tyr Ala 
20 25 30 



Thr Thr Ser Tyr Val Phe Arg Asp Cys Asp His Gly Gly Arg Leu Phe 
35 40 45 



Gly Leu Gin Glu Pro Gly Tyr He Tyr Ser Arg Met Met Asn Pro Thr 
50 55 60 



Ala Asp Val Phe Glu Lys Arg He Ala Ala Leu Glu His Gly Ala Ala 
65 70 75 60 



Ala He Ala Thr Ser Ser Gly Thr Ser Ala Leu Phe Met Ala Leu Thr 
85 90 95 



Thr Leu Ala Lys Ala Gly Asp Asn He Val Ser Thr Ser Tyr Leu Tyr 
100 105 110 



Gly Gly Thr Tyr Asn Leu Phe Lys Val Thr Leu Pro Arg Leu Gly He 
115 120 125 



Thr Thr Lys Phe Val Asn Gly Asp Asp Pro Asn Asp Leu Ala Ala Gin 
130 135 140 



He Asp Glu Asn Thr Lys Ala Val Tyr Val Glu Ser He Gly Asn Pro 
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145 150 155 160 



Met Tyr Asn Val Pro Asp Phe Glu Arg He Ala Glu Val Ala His Ala 
165 170 175 



Ala Gly Val Pro Leu Met Val Asp Asn Thr Phe Gly Gly Gly Gly Tyr 
180 185 190 



Leu Val Arg Pro He Asp His Gly Ala Asp He Val Thr His Ser Ala 
195 200 205 



Thr Lys Trp He Gly Gly His Gly Thr Thr He Gly Gly Val He Val 
210 215 220 

Asp Ser Gly Lys Phe Asp Trp Lys Lys Asn Ser Lys Arg Phe Pro Glu 

225 230 235 240 



Phe Asn Glu Pro His Pro Gly Tyr His Gly Met Val Phe Thr Glu Thr 
245 250 255 



Phe Gly Asn Leu Ala Tyr Ala Phe Ala Cys Arg Thr Gin Thr Leu Arg 
260 265 270 



Asp Val Gly Gly Asn Ala Asn Pro Phe Gly Val Phe Leu Leu Leu Gin 
275 280 285 

Gly lieu Glu Thr Leu Ser Leu Arg Met Glu Arg His Val Gin Asn Ala 
290 295 300 

Phe Ala Leu Ala Lys Tyr Leu Glu Lys His Pro Lys Val Asn Trp Val 
305 310 315 320 

Ser Tyr Pro Gly Leu Glu Ser His Val Ser His Lys Leu Ala Lys Lys 
325 330 335 



Tyr Leu Lys Asn Gly Tyr Gly Ala Val Leu Ser Phe Gly Ala Lys Gly 
340 345 350 



Gly Pro Asp Gin Ser Arg Lys Val Val Asn Ala Leu Lys Leu Ala Ser 
355 360 365 



Gin Leu Ala Asn Val Gly Asp Ala Lys Thr Leu Val He Ala Pro Ala 
370 375 380 



Tyr Thr Thr His Leu Gin Leu Thr Asp Glu Glu Gin He Ser Ala Gly 
385 390 395 400 
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Val Thr Lys Asp Leu lie Arg Val Ala Val Gly lie Glu His lie Asp 
405 410 415 



Asp He He Ala Asp Phe Ala Gin Ala Leu Glu Val Ala 
420 425 



<210> 55 
<211> 52 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 55 

cccgggatcc gctagcggcg cgccggccgg cccggtgtga aataccgcac ag 52 

<210> 56 
<211> 53 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : PCR primer 
<400> 56 

tctagactcg agcggccgcg gccggccttt aaattgaaga cgaaagggcc teg 53 

<210> 57 
<211> 47 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 57 

gagatctaga cccggggatc cgctagcggg ctgetaaagg aagcgga 47 

<210> 58 
<211> 38 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz rPCR primer 
<400> 58 

gagaggegeg ccgctagcgt gggcgaagaa ctccagca 38 

<210> 59 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: PCR primer 



WO 2004/024933 




PCT/EP2003/009453 



<400> 59 

gagagggcgg ccgcgcaaag tcccgcttcg tgaa 

<210> 60 
<21l> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 60 

gagagggcgg ccgctcaagt cggtcaagcc acgc 



<210> 61 
<211> 140 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 61 

tcgaatttaa atctcgagag gcctgacgtc gggcccggta ccacgcgtca tatgactagt 60 
tcggacctag ggatatcgfcc gacatcgatg ctcttctgcg ttaattaaca attgggatcc 120 
tctagacccg ggatttaaat 

<210> 62 
<211> 140 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 62 

gatcatttaa atcccgggtc tagaggatcc caattgttaa ttaacgcaga agagcatcga 60 
tgtcgacgat atccctaggt ccgaactagt catatgacgc gtggtaccgg gcccgacgtc 120 
aggcctctcg agatttaaat ~ * * 14Q 

<210> 63 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 63 

gagagcggcc gccgatcctt tttaacccat cac 33 

<210> 64 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 
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<223> Beschreibung der kunstlichen Sequenz:PCR primer 
<400> 64 

aggagcggcc gccatcggca ttttcttttg eg 32 



<210> 65 
<211> 5091 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Plasraid 
<400> 65 

gccgcgactg ccttcgcgaa gccttgcccc gcggaaattt cctccaccga gttcgtgcac 60 
acccctatgc caagcttctt tcaccctaaa ttcgagagat tggattctta ccgtggaaat 120 
tettegcaaa aatcgtcccc tgatcgccct tgcgacgttg gcgtcggtgc cgctggtfcgc 180 
gcttggcttg accgacttga tcagcggccg ctcgatttaa atctcgagag gcctgacgtc 240 
gggcccggta ccacgcgtca tatgactagt teggacctag ggatatcgtc gacatcgatg 300 
ctcttctgcg ttaattaaca attgggatcc tctagacccg ggatttaaat cgctagcggg 360 
ctgetaaagg aageggaaca egtagaaage cagtccgcag aaacggtgct gaccccggat 420 
gaatgtcagc tactgggcta tctggacaag ggaaaacgea agegcaaaga gaaagcaggt 480 
agettgeagt gggcttacat ggegataget agactgggcg gtttfcatgga cagcaagega 540 
aceggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca aagtaaactg 600 
gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagatctg atcaagagac 660 
aggatgagga tegtttcgea tgattgaaca agatggattg caegcaggtt ctccggccgc 720 
ttgggtggag aggctattcg gctatgactg ggcacaacag acaategget getctgatge 780 
cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc 840 
cggtgccctg aatgaactgc aggacgaggc agegeggcta tcgtggctgg ccacgacggg 900 
cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatfc 960 
gggcgaagtg ceggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc 1020 
catcatggct gatgeaatge ggeggctgea tacgettgat ccggctacct gcccattcga 1080 
ccaccaagcg aaacatcgea tegagegage aegtactegg atggaagccg gtcttgtcga 1140 
tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gecgaactgt tcgccaggct 1200 
caaggcgcgc atgcccgacg gegaggatet cgtcgtgacc catggcgatg cctgcfctgcc 1260 
gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt 1320 
ggcggaccgc tatcaggaca tagcgttggc taccegtgat attgetgaag agettggegg 1380 
cgaatgggct gaccgcttcc tegtgettta cggtatcgcc gctcccgatt cgcagcgcat 1440 
cgccttctat cgccttcttg acgagttctt ctgagcggga ctctggggtt cgaaatgacc 1500 
gaecaagega cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 1560 
aggttgggct teggaategt tttcegggae gccggctgga tgatcctcca gegeggggat 1620 
etcatgetgg agttcttcgc ccacgctagc ggcgcgccgg ccggcccggt gtgaaatacc 1680 
geacagatge gtaaggagaa aatacegcat caggcgctct tccgcttcct cgctcactga 1740 
ctcgctgcgc teggtegtte ggctgcggcg ageggtatea gctcactcaa aggeggtaat 1800 
aeggttatec acagaatcag gggataaege aggaaagaac atgtgagcaa aaggecagea 1860 
aaaggecagg aacegtaaaa aggecgegtt gctggcgttt ttccataggc tccgcccccc 1920 
tgacgagcat cacaaaaatc gaegctcaag tcagaggtgg cgaaacccga caggactata 1980 
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 2040 
gettacegga tacctgtccg cctttctccc ttegggaage gtggcgcttt ctcatagctc 2100 
aegctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 2160 
accccccgtt cagcccgacc gctgcgcctt ateeggtaac tategtcttg agtccaaccc 2220 
ggtaagacac gaettatege cactggcagc agccactggt aacaggatta geagagegag 2280 
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactaegget acactagaag 2340 
gacagtattt ggtatctgcg etctgetgaa gccagttacc ttcggaaaaa gagttggtag 2400 
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 2460 
gattacgege agaaaaaaag gatctcaaga agatcctttg atcttttcta eggggtctga 2520 
cgcfccagtgg aacgaaaact caegttaagg gattttggtc atgagattat caaaaaggat 2580 
cttcacctag atccttttaa aggccggccg cggccgcgca aagtcccgct tcgtgaaaat 2640 
tttcgtgccg cgtgattttc cgccaaaaac tttaacgaac gttcgttata atggtgtcat 2700 
gaccttcacg acgaagtact aaaattggcc cgaatcatca gctatggatc tctctgatgt 2760 
cgcgctggag tccgacgcgc tegatgetge cgtcgattta aaaacggtga teggattttt 2820 
ccgagctctc gatacgaegg acgcgccagc atcacgagac tgggccagtg ccgcgagcga 2880 
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cctagaaact ctcgtggcgg atcttgagga gctggctgac gagctgcgtg ctcggccagc 2940 
gccaggagga cgcacagtag tggaggatgc aatcagttgc gcctactgcg gtggcctgat 3000 
tcctccccgg cctgacccgc gaggacggcg cgcaaaatat tgctcagatg cgtgfccgtgc 3060 
cgcagccagc cgcgagcgcg ccaacaaacg ccacgccgag gagctggagg cggctaggtc 3120 
gcaaatggcg ctggaagtgc gtcccccgag cgaaattttg gccatggtcg tcacagagct 3180 
ggaagcggca gcgagaatta tcgcgatcgt ggcggtgccc gcaggcatga caaacatcgt 3240 
aaatgccgcg tttcgtgfcgc cgtggccgcc caggacgtgt cagcgccgcc accacctgca 3300 
ccgaatcggc agcagcgtcg cgcgtcgaaa aagcgcacag gcggcaagaa gcgataagct 3360 
gcacgaatac ctgaaaaatg ttgaacgccc cgtgagcggt aactcacagg gcgtcggcta 3420 
acccccagtc caaacctggg agaaagcgct caaaaatgac tctagcggat tcacgagaca 3480 
ttgacacacc ggcctggaaa ttttccgctg atctgttcga cacccatccc gagctcgcgc 3540 
tgcgatcacg tggctggacg agcgaagacc gccgcgaatt cctcgctcac ctgggcagag 3600 
aaaatttcca gggcagcaag acccgcgact tcgccagcgc ttggatcaaa gacccggaca 3660 
cggagaaaca cagccgaagt tataccgagt tggttcaaaa tcgcttgccc ggtgccagta 3720 
tgttgctctg acgcacgcgc agcacgcagc cgtgcttgtc ctggacattg atgtgccgag 3780 
ccaccaggcc ggcgggaaaa tcgagcacgt aaaccccgag gtctacgcga ttttggagcg 3840 
ctgggcacgc ctggaaaaag cgccagcttg gatcggcgtg aatccactga gcgggaaatg 3900 
ccagctcatc tggctcattg atccggtgta tgccgcagca ggcatgagca gcccgaatat 3960 
gcgcctgctg gctgcaacga ccgaggaaat gacccgcgtt ttcggcgctg accaggcttt 4020 
ttcacatagg ctgagccgtg gccactgcac tctccgacga tcccagccgt accgctggca 4080 
tgcccagcac aatcgcgtgg atcgcctagc tgatcttatg gaggttgctc gcatgatctc 414 0 
aggcacagaa aaacctaaaa aacgctatga gcaggagttt tctagcggac gggcacgtat 4200 
cgaagcggca agaaaagcca ctgcggaagc aaaagcactt gccacgcttg aagcaagcct 4260 
gccgagcgcc gctgaagcgt ctggagagct gatcgacggc gtccgtgtcc tctggactgc 4320 
tccagggcgt gccgcccgtg atgagacggc ttttcgccac gctttgactg tgggatacca 4380 
gttaaaagcg gctggtgagc gcctaaaaga caccaagggt catcgagcct acgagcgtgc 4440 
ctacaccgtc gctcaggcgg tcggaggagg ccgtgagcct gatctgccgc cggactgtga 4500 
ccgccagacg gattggccgc gacgtgtgcg cggctacgtc gctaaaggcc agccagtcgt 4560 
ccctgctcgt cagacagaga cgcagagcca gccgaggcga aaagctctgg ccactatggg 4620 
aagacgtggc ggtaaaaagg ccgcagaacg ctggaaagac ccaaacagtg agtacgcccg 4680 
agcacagcga gaaaaactag ctaagtccag tcaacgacaa gctaggaaag ctaaaggaaa 4740 
tcgcttgacc attgcaggtt ggtttatgac tgttgaggga gagactggct cgtggccgac 4800 
aatcaatgaa gctatgtctg aatttagcgt gtcacgtcag accgtgaata gagcacttaa 4860 
ggtctgcggg cattgaactt ccacgaggac gccgaaagct tcccagtaaa tgtgccatct 4920 
cgtaggcaga aaacggttcc cccgtagggt ctctctcttg gcctcctttc taggtcgggc 4980 
tgattgctct tgaagctctc taggggggct cacaccatag gcagataacg ttccccaccg 5040 
gctcgcctcg taagcgcaca aggactgctc ccaaagatct tcaaagccac t 5091 



<210> 66 
<211> 4323 
<212> DMA 

<213> KOnstliche Sequenz 
<220> 

<223> Beschreibung der kunsfclicaen Sequenz i PI asmid 
<400> 66 

tctctcagcg tatggttgtc gcctgagctg tagttgcctfc catcgatgaa ctgctgtaca 60 
ttttgatacg tttttccgtc accgtcaaag attgatttat aatcctctac accgttgatg 120 
ttcaaagagc tgtctgatgc tgatacgtta acttgtgcag ttgtcagtgt ttgtttgccg 180 
taatgtttac cggagaaatc agtgtagaat aaacggattt ttccgtcaga tgtaaatgtg 240 
gctgaacctg accattcttg tgtttggtct tttaggatag aatcatttgc atcgaatttg 300 
tcgctgtctt taaagacgcg gccagcgttt ttccagctgt caatagaagt ttcgccgact 360 
ttttgataga acatgtaaat cgatgtgtca tccgcatttt taggatctcc ggctaatgca 420 
aagacgatgt ggtagccgtg atagtttgcg acagtgccgt cagcgttttg taatggccag 4 80 
ctgtcccaaa cgtccaggcc ttttgcagaa gagatatttt taattgtgga cgaatcaaat 540 
tcagaaactt gatatttttc atttttttgc tgttcaggga tttgcagcat atcatggcgt 600 
gtaatatggg aaatgccgta tgtttcctta tatggctttt ggttcgtttc tttcgcaaac 660 
gcttgagttg cgcctcctgc cagcagtgcg gtagtaaagg ttaatactgt tgcttgtttt 720 
gcaaactttt tgatgttcat cgttcatgtc tcctttttta tgtactgtgt tagcggtctg 780 
cttcttccag ccctcctgtt tgaagatggc aagttagtta cgcacaataa aaaaagacct 84 0 
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aaaatatgta aggggtgacg ccaaagtata cactttgccc tttacacatt ttaggtcfctg 900 
cctgctttat cagtaacaaa cccgcgcgat ttacttttcg acctcattct attagactct 960 
cgtttggatt gcaactggtc tattttcctc ttttgtttga tagaaaatca taaaaggatt 1020 
tgcagactac gggcctaaag aactaaaa'aa tctatctgtt tcttttcatt ctctgtattt 1080 
tttatagttt ctgttgcatg ggcataaagt tgccttttta atcacaattc agaaaatatc 1140 
ataatatctc atttcactaa ataatagtga acggcaggta tatgtgatgg gttaaaaagg 1200 
atcggcggcc gctcgattta aatctcgaga ggcctgacgt cgggcccggt accacgcgtc 1260 
atatgactag ttcggaccta gggatatcgt cgacatcgat gctcttctgc gttaattaac 1320 
aattgggatc ctctagaccc gggatttaaa tcgctagcgg gctgctaaag gaagcggaac 1380 
acgtagaaag ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag ctactgggct 1440 
atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag tgggcttaca 1500 
tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt gccagctggg 1560 
gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt cttgccgcca 1620 
aggatctgat ggcgcagggg atcaagatct gatcaagaga caggatgagg atcgtttcgc 1680 
atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 1740 
ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 1800 
gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 1860 
caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 1920 
ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 1980 
gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 2040 
cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 2100 
atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 2160 
gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac 2220 
ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 2280 
ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 2340 
atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 2400 
ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 2460 
gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg acgcccaacc 2520 
tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 2580 
ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 2640 
cccacgctag cggcgcgccg gccggcccgg tgtgaaatac cgcacagatg cgtaaggaga 2700 
aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 2760 
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 2820 
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 2880 
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 2940 
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 3000 
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 3060 
gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 3120 
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 3180 
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 3240 
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 3300 
gagfctcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 3360 
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 3420 
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 3480 
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 3540 
tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 3600 
aaggccggcc gcggccgcca tcggcatttt cttttgcgtt tttatttgtt aactgttaat 3660 
tgtccttgtt caaggatgct gtctttgaca acagatgttt tcttgccttt gatgttcagc 3720 
aggaagctcg gcgcaaacgt tgattgtttg tctgcgtaga atcctctgtt tgtcatatag 3780 
cttgtaatca cgacattgtt tcctttcgct tgaggtacag cgaagtgtga gtaagtaaag 3840 
gttacatcgt taggatcaag atccattttt aacacaaggc cagttttgtt cagcggcttg 3900 
tatgggccag ttaaagaatt agaaacataa ccaagcatgt aaatatcgtt agacgtaatg 3960 
ccgtcaatcg tcatttttga tccgcgggag tcagtgaaca ggtaccattt gccgttcatt 4020 
ttaaagacgt tcgcgcgttc aatttcatct gttactgtgt tagatgcaat cagcggtttc 4080 
atcacttttt tcagtgtgta atcatcgttt agctcaatca taccgagagc gccgtttgct 4140 
aactcagccg tgcgtttttt atcgctttgc agaagttttt gactttcttg acggaagaat 4200 
gatgtgcttt tgccatagta tgctttgtta aataaagatt cttcgccttg gtagccatct 4260 
tcagttccag tgtttgcttc aaatactaag tatttgtggc ctttatcttc tacgtagtga 4320 
gga 4323 
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<210> 67 
<211> 35 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 67 

gagagagaga cgcgtcccag tggctgagac gcatc 35 



<210> 68 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 68 

ctctctctgt cgacgaattc aatcttacgg cctg 34 



<210> 69 
<211> 5860 
<212> DNA. 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz : PI asmid 



<400> 69 

cccggtacca cgcgtcccag 


tggctgagac 


gcatccgcta 


aagccccagg 


aaccctgtgc 


60 


agaaagaaaa cactcctctg 


gctaggtaga 


cacagtttat 


aaaggtagag 


ttgagcgggt 


120 


aactgtcagc acgtagatcg 


aaaggtgcac 


aaaggtggcc 


ctggtcgtac 


agaaatatgg 


180 


cggttcctcg cttgagagtg 


cggaacgcat 


tagaaacgtc 


gctgaacgga 


tcgttgccac 


240 


caagaaggct ggaaatgatg 


tcgtggttgt 


ctgctccgca 


atgggagaca 


ccacggatga 


300 


acttctagaa cttgcagcgg 


cagtgaatcc 


cgttccgcca 


gctcgtgaaa 


tggatatgct 


360 


cctgactgct ggtgagcgta 


tttctaacgc 


tctcgtcgcc 


atggctattg 


agtcccttgg 


420 


cgcagaagcc caatctttca 


cgggctctca 


ggctggtgtg 


ctcaccaccg 


agcgccacgg 


480 


aaacgcacgc attgttgatg 


tcactccagg 


tcgtgtgcgt 


gaagcactcg 


atgagggcaa 


540 


gatctgcatt gttgctggtt 


tccagggtgt 


taataaagaa 


acccgcgatg 


tcaccacgtt 


600 


gggtcgtggt ggttctgaca 


ccactgcagt 


tgcgttggca 


gctgctttga 


acgctgatgt 


660 


gtgtgagatt tactcggacg 


ttgacggtgt 


gtataccgct 


gacccgcgca 


tcgttcctaa 


720 


tgcacagaag ctggaaaagc 


tcagcttcga 


agaaatgctg 


gaacttgctg 


ctgttggctc 


780 


caagattttg gtgctgcgca 


gtgttgaata 


cgctcgtgca 


ttcaatgtgc 


cacttcgcgt 


840 


acgctcgtct tatagtaatg 


atcccggcac 


tttgattgcc 


ggctctatgg 


aggatattcc 


900 
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tgtggaagaa gcagtcctta ccggtgtcgc aaccgacaag tccgaagcca aagtaaccgt 960 

tctgggtatt tccgataagc caggcgaggc tgcgaaggtt ttccgtgcgt tggctgafcgc 1020 

agaaatcaac attgacatgg ttctgcagaa cgtctcttct gtagaagacg gcaccaccga 1080 

catcaccttc acctgccctc gttccgacgg ccgccgcgcg atggagatct tgaagaagct 1140 

tcaggttcag ggcaactgga ccaatgtgct ttacgacgac caggtcggca aagtctccct 1200 

cgtgggtgct ggcatgaagt ctcacccagg tgttaccgca gagttcatgg aagctctgcg 1260 

cgatgtcaac gtgaacatcg aattgatttc cacctctgag attcgtattt ccgtgctgat 1320 

ccgtgaagat gatctggatg ctgctgcacg tgcattgcat gagcagttcc agctgggcgg 1380 

cgaagacgaa gccgtcgttt atgcaggcac cggacgctaa agttttaaag gagtagtttt 1440 

acaatgacca ccatcgcagt tgttggtgca accggccagg tcggccaggt tatgcgcacc 1500 

cttttggaag agcgcaattt cccagctgac actgttcgtt tctttgcttc cccacgttcc 1560 

gcaggccgta agattgaatt cgtcgacatc gatgctcttc tgcgttaatt aacaattggg 1620 

atcctctaga cccgggattt aaatcgctag cgggctgcta aaggaagcgg aacacgtaga 1680 

aagccagtcc gcagaaacgg tgctgacccc ggatgaatgt cagctactgg gctatctgga 1740 

caagggaaaa cgcaagcgca aagagaaagc aggtagcttg cagtgggctt acatggcgat 1800 

agctagactg ggcggtttta tggacagcaa gcgaaccgga attgccagct ggggcgccct 1860 

ctggtaaggt tgggaagccc tgcaaagtaa actggatggc tttcttgccg ccaaggatct 1920 

gatggcgcag gggatcaaga tctgatcaag agacaggatg aggatcgttt cgcatgattg I960 

aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta ttcggctatg 2040 

actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg tcagcgcagg 2100 

ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg 2160 

aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg 2220 

ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg caggatctcc 2280 

tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca atgcggcggc 2340 

tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat cgcatcgagc 2400 

gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac gaagagcatc 2460 

a 999gctcgc gccagccgaa ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg 2520 

atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa aatggccgct 2580 

tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag gacatagcgt 2640 

tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc 2700 

tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt 2760 

tcttctgagc gggactctgg ggttcgaaat gaccgaccaa gcgacgccca acctgccatc 2820 
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acgagatttc gattccaccg 


ccgccttcta 


tgaaaggttg 


ggcttcggaa 


tcgttttccg 


2880 


ggacgccggc tggatgatcc 


tccagcgcgg 


ggatctcatg 


ctggagttct 


tcgcccacgc 


2940 


tagcggcgcg ccggccggcc 


cggtgtgaaa 


taccgcacag 


atgcgtaagg 


agaaaatacc 


3000 


gcatcaggcg ctcttccgct 


tcctcgctca 


ctgactcgct 


gcgctcggtc 


gttcggctgc 


3060 


ggcgagcggt atcagctcac 


tcaaaggcgg 


taatacggtt 


atccacagaa 


tcaggggata 


3120 


acgcaggaaa gaacatgtga 


gcaaaaggcc 


agcaaaaggc 


caggaaccgt 


aaaaaggccg 


3180 


cgttgctggc gtttttccat 


aggctccgcc 


cccctgacga 


gcatcacaaa 


aatcgacgct 


3240 


caagtcagag gtggcgaaac 


ccgacaggac 


tataaagata 


ccaggcgttt 


ccccctggaa 


3300 


gctccctcgt gcgctctcct gttccgaccc 


tgccgcttac 


cggatacctg 


tccgcctttc 


3360 


tcccttcggg aagcgtggcg 


ctttctcata 


gctcacgctg 


taggtatctc 


agttcggtgt 


3420 


aggtcgttcg ctccaagctg ggctgtgtgc 


acgaaccccc 


cgttcagccc 


gaccgctgcg 


3480 


ccttatccgg taactatcgt 


cfctgagtcca 


acccggtaag 


acacgactta 


tcgccactgg 


3540 


cagcagccac tggtaacagg 


attagcagag 


cgaggtatgt 


aggcggtgct 


acagagttct 


3600 


tgaagtggtg gcctaactac ggctacacta gaaggacagt 


atttggtatc 


tgcgctctgc 


3660 


tgaagccagt taccttcgga 


aaaagagttg 


gtagctcttg 


atccggcaaa 


caaaccaccg 


3720 


ctggtagcgg tggfctttttt 


gfcttgcaagc 


agcagattac 


gcgcagaaaa 


aaaggatctc 


3780 


aagaagatcc tttgatcttt 


tctacggggt 


ctgacgctca 


gtggaacgaa 


aactcacgtt 


3840 


aagggatttt ggtcatgaga 


ttatcaaaaa 


ggatcttcac 


ctagatcctt 


ttaaaggccg 


3900 


gccgcggccg ccatcggcat 


tttcttttgc 


gtttttattt 


gttaactgtt 


aattgtcctt 


3960 


gttcaaggat gctgtctttg 


acaacagatg 


ttttcttgcc 


tttgatgttc 


agcaggaagc 


4020 


tcggcgcaaa cgttgattgt 


ttgtctgcgt 


agaatcctct 


gtttgtcata 


tagcttgtaa 


4080 


tcacgacatt gtttcctttc gcttgaggta cagcgaagtg 


tgagtaagta 


aaggttacat 


4140 


cgttaggatc aagatccatt 


tttaacacaa 


ggccagtttt 


gttcagcggc 


ttgtatgggc 


4200 


cagttaaaga attagaaaca 


taaccaagca 


tgtaaatatc 


gttagacgta 


atgccgtcaa 


4260 


tcgtcatttt tgatccgcgg 


gagtcagtga 


acaggtacca 


tttgccgttc 


attttaaaga 


4320 


cgttcgcgcg ttcaatttca 


tctgttactg 


tgttagatgc 


aatcagcggt 


ttcatcactt 


4380 


ttttcagtgt gtaatcatcg 


tttagctcaa 


tcataccgag 


agcgccgttt 


gctaactcag 


4440 


ccgtgcgttt tttatcgctt 


tgcagaagtt 


tttgactttc 


ttgacggaag 


aatgatgtgc 


4500 


Ctttgccata gtatgctttg 


ttaaataaag 


attcttcgcc 


ttggtagcca 


tcttcagttc 


4560 


cagtgtttgc ttcaaatact 


aagtatttgt ggcctttatc 


ttctacgtag 


tgaggatctc 


4620 


tcagcgtatg gttgtcgcct gagctgtagt 


tgccttcatc 


gatgaactgc 


tgtacatttt 


4680 
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gatacgtttt tccgtcaccg tcaaagattg atttataatc 
aagagctgtc tgatgctgat acgttaactt gtgcagttgt 
gtttaccgga gaaatcagtg tagaataaac ggatttttcc 
aacctgacca ttcttgtgtt tggtctttta ggatagaatc 
tgtctttaaa gacgcggcca gcgtttttcc agctgtcaat 
gatagaacat gtaaatcgat gtgtcatccg catttttagg 
cgatgtggta gccgtgatag tttgcgacag tgccgtcagc 
cccaaacgtc caggcctttt gcagaagaga tatttttaat 
aaacttgata tttttcattt ttttgctgtt cagggatttg 
tatgggaaat gccgtatgtt tccttatatg gcttttggtt 
gagttgcgcc tcctgccagc agtgcggtag taaaggttaa 
actttttgat gttcatcgtt catgtctcct tttttatgta 
ttccagccct cctgtttgaa gatggcaagt tagttacgca 
tatgtaaggg gtgacgccaa agtatacact ttgcccttta 
ctttatcagt aacaaacccg cgcgatttac ttttcgacct 
tggattgcaa ctggtctatt ttcctctttt gtttgataga 
gactacgggc ctaaagaact aaaaaatcta tctgtttctt 
tagtttctgt tgcatgggca taaagttgcc tttttaatca 
tatctcattt cactaaataa tagtgaacgg caggtatatg 
gcggccgctc gatttaaatc tcgagaggcc tgacgtcggg 
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ctctacaccg ttgatgttca 4740 

cagtgtttgt ttgccgtaat 4800 

gtcagatgta aatgtggctg 4860 

atttgcatcg aatttgtcgc 4920 

agaagtttcg ccgacttttt 4980 

atctccggct aatgcaaaga 5040 

gttttgtaat ggccagctgt 5100 

tgtggacgaa tcaaattcag 5160 

cagcatatca tggcgtgtaa 5220 

cgtttctttc gcaaacgctt 5280 

tactgttgct tgttttgcaa 5340 

ctgtgttagc ggtctgcttc 5400 

caataaaaaa agacctaaaa 5460 

cacattttag gtcttgcctg 5520 

cattctatta gactctcgtt 5580 

aaatcataaa aggatttgca 5640 

ttcattctct gtatttttta 5700 

caattcagaa aatatcataa 5760 

tgatgggtta aaaaggatcg 5820 

S860 



<210> 70 
<211> 38 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : PCR primer 
<400> 70 

cggcaccacc gacatcatct tcacctgccc tcgttccg 



38 



<210> 71 
<211> 38 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: PCR primer 
<400> 71 

cggaacgagg gcaggtgaag atgatgtcgg tggtgccg 



38 



V 
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<210> 


72 




<211> 


1266 




<212> 


DMA 




<213> 


LysC 


Mutante 


<220> 






<221> 


CDS 




<222> 


(1) . - 


(1266) 


<223> 






<400> 


72 





gtg gcc ctg gtc gta cag aaa tat ggc ggt tec teg ctt gag agt gcg 48 
Val Ala Leu Val Val Gin Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala 
15 10 15 

gaa cgc att aga aac gtc get gaa egg ate gtt gcc acc aag aag get 96 
Glu Arg lie Arg Asn Val Ala Glu Arg lie Val Ala Thr Lys Lys Ala 
20 25 30 

gga aat gat gtc gtg gtt gtc tgc tec gca atg gga gac acc acg gat 144 
Gly Asn Asp Val Val Val Val Cys Ser Ala Met Gly Asp Thr Thr Asp 
35 40 45 

gaa ctt eta gaa ctt gca gcg gca gtg aat ccc gtt ccg cca get cgt 192 
Glu Leu Leu Glu Leu Ala Ala Ala Val Asn Pro Val Pro Pro Ala Arg 
50 55 60 

gaa atg gat atg etc ctg act get ggt gag cgt att tct aac get etc 240 
Glu Met Asp Met Leu Leu Thr Ala Gly Glu Arg lie Ser Asn Ala Leu 
65 70 75 80 

gtc gcc atg get att gag tec ctt ggc gca gaa gcc caa tct ttc acg 2 88 

Val Ala Met Ala lie Glu Ser Leu Gly Ala Glu Ala Gin Ser Phe Thr 
85 90 95 

ggc tct cag get ggt gtg etc acc acc gag cgc cac gga aac gca cgc 336 
Gly Ser Gin Ala Gly Val Leu Thr Thr Glu Arg His Gly Asn Ala Arg 
100 105 110 

att gtt gat gtc act cca ggt cgt gtg cgt gaa gca etc gat gag ggc 384 
lie Val Asp Val Thr Pro Gly Arg Val Arg Glu Ala Leu Asp Glu Gly 
115 120 125 

aag ate tgc att gtt get ggt ttc cag ggt gtt aat aaa gaa acc cgc 432 
Lys He Cys He Val Ala Gly Phe Gin Gly Val Asn Lys Glu Thr Arg 
130 135 140 

gat gtc acc acg ttg ggt cgt ggt ggt tct gac acc act gca gtt gcg 480 
Asp Val Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala 
145 150 155 1 60 

ttg gca get get ttg aac get gat gtg tgt gag att tac teg gac gtt 528 
Leu Ala Ala Ala Leu Asn Ala Asp Val Cys Glu He Tyr Ser Asp Val 
165 170 ^ 175 

gac ggt gtg tat acc get gac ccg cgc ate gtt cct aat gca cag aag 576 
Asp Gly Val Tyr Thr Ala Asp Pro Arg lie Val Pro Asn Ala Gin Lys 
180 185 190 

ctg gaa aag etc age ttc gaa gaa atg ctg gaa ctt get get gtt ggc 624 
Leu Glu Lys Leu Ser Phe Glu Glu Met Leu Glu Leu Ala Ala Val Gly 
195 200 205 
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tec aag att ttg gtg ctg cgc agt gtt gaa tac get cgt gca ttc aat 672 
Ser Lys lie Leu Val Leu Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn 
210 215 220 

gtg cca ctt cgc gta cgc teg tct tat agt aat gat ccc ggc act ttg 720 
Val pro Leu Arg Val Arg Ser Ser Tyr Ser Asn Asp Pro Gly Thx Leu 
225 230 235 240 

att gec ggc tct atg gag gat att cct gtg gaa gaa gca gtc ctt acc 768 
lie Ala Gly Ser Met Glu Asp lie Pro Val Glu Glu Ala Val Leu Thr 
245 250 255 

ggt gtc gca acc gac aag tec gaa gee aaa gta acc gtt ctg ggt att 816 
Gly Val Ala Thr Asp Lys Ser Glu Ala Lys Val Thr Val Leu Gly He 
260 265 270 

tec gat aag cca ggc gag get gcg aag gtt ttc cgt gcg ttg get gat 864 
Ser Asp Lys Pro Gly Glu Ala Ala Lys Val Phe Arg Ala Leu Ala Asp 
275 280 285 

gca gaa ate aac att gac atg gtt ctg cag aac gtc tct tct gta gaa 912 
Ala Glu He Asn He Asp Met Val Leu Gin Asn Val Ser Ser Val Glu 
290 295 300 

gac ggc acc acc gac ate ate ttc acc tgc cct cgt tec gac ggc cgc 960 
Asp Gly Thr Thr Asp lie lie Phe Thr Cys Pro Arg Ser Asp Gly Arg 
305 310 315 320 

cgc gcg atg gag ate ttg aag aag ctt cag gtt cag ggc aac tgg acc 1008 
Arg Ala Met Glu lie Leu Lys Lys Leu Gin Val Gin Gly Asn Trp Thr 
325 330 335 

aat gtg ctt tac gac gac cag gtc ggc aaa gtc tec etc gtg ggt get 1056 
Asn Val Leu Tyr Asp Asp Gin Val Gly Lys Val Ser Leu Val Gly Ala 
340 345 350 

ggc atg aag tct cac cca ggt gtt acc gca gag ttc atg gaa get ctg 1104 
Gly Met Lys Ser His Pro Gly Val Thr Ala Glu Phe Met Glu Ala Leu 
355 360 365 

cgc gat gtc aac gtg aac ate gaa ttg att tec acc tct gag att cgt 1152 
Arg Asp Val Asn Val Asn He Glu Leu He Ser Thr Ser Glu He Arg 
370 375 380 

att tec gtg ctg ate cgt gaa gat gat ctg gat get get gca cgt gca 1200 
He Ser Val Leu He Arg Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala 
385 390 395 400 

ttg cat gag cag ttc cag ctg ggc ggc gaa gac gaa gee gtc gtt tat 1248 
Leu His Glu Gin Phe Gin Leu Gly Gly Glu Asp Glu Ala Val Val Tyr 
405 410 415 

gca ggc acc gga cgc taa 1266 
Ala Gly Thr Gly Arg 
420 



<210> 73 

<211> 421 

<212> PRT 

<213> LysC Mutante 
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<400> 73 

Val Ala Leu Val Val Gin Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala 
1 5 10 15 

Glu Arg He Arg Asn Val Ala Glu Arg He Val Ala Thr Lys Lys Ala 
20 25 30 

Gly Asn Asp Val Val Val Val Cys Ser Ala Met Gly Asp Thr Thr Asp 
35 40 45 

Glu Leu Leu Glu Leu Ala Ala Ala Val Asn Pro Val Pro Pro Ala Arg 
50 55 60 

Glu Met Asp Met Leu Leu Thr Ala Gly Glu Arg He Ser Asn Ala Leu 
65 70 75 80 

Val Ala Met Ala lie Glu Ser Leu Gly Ala Glu Ala Gin Ser Phe Thr 
85 50 95 

Gly Ser Gin Ala Gly Val Leu Thr Thr Glu Arg His Gly Asn Ala Arg 
100 105 HO 

He Val Asp Val Thr Pro Gly Arg Val Arg Glu Ala Leu Asp Glu Gly 
115 120 125 

Lys He Cys He Val Ala Gly Phe Gin Gly Val Asn Lys Glu Thr Arg 
130 135 140 

Asp Val Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala 
14 5 150 155 160 

Leu Ala Ala Ala Leu Asn Ala Asp Val Cys Glu He Tyr Ser Asp Val 
165 170 175 

Asp Gly Val Tyr Thr Ala Asp Pro Arg He Val Pro Asn Ala Gin Lys 
180 185 190 

Leu Glu Lys Leu Ser Phe Glu Glu Met Leu Glu Leu Ala Ala Val Gly 
195 200 205 

Ser Lys He Leu Val Leu Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn 
210 215 220 

Val Pro Leu Arg Val Arg Ser Ser Tyr Ser Asn Asp Pro Gly Thr Leu 
225 230 235 240 



He Ala Gly Ser Met Glu Asp H e Pro Val Glu Glu Ala Val Leu Thr 
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245 250 255 



Gly Val Ala Thr Asp Lys Ser Glu Ala Lys Val Thr Val Leu Gly He 
260 265 270 



Ser Asp Lys Pro Gly Glu Ala Ala Lys Val Phe Arg Ala Leu Ala Asp 
275 280 285 



Ala Glu He Asn He Asp Met Val Leu Gin Asn Val Ser Ser Val Glu 
290 295 300 



Asp Gly Thr Thr Asp He He Phe Thr Cys Pro Arg Ser Asp Gly Arg 
305 310 315 320 



Arg Ala Met Glu He Leu Lys Lys Leu Gin Val Gin Gly Asn Trp Thr 
325 330 335 



Asn Val Leu Tyr Asp Asp Gin Val Gly Lys Val Ser Leu Val Gly Ala 
340 345 350 



Gly Met Lys Ser His Pro Gly Val Thr Ala Glu Phe Met Glu Ala Leu 
355 360 365 



Arg Asp Val Asn Val Asn He Glu Leu He Ser Thr Ser Glu He Arg 
370 375 380 



He Ser Val Leu He Arg Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala 
385 390 395 400 



Leu His Glu Gin Phe Gin Leu Gly Gly Glu Asp Glu Ala Val Val Tyr 
405 410 415 



Ala Gly Thr Gly Arg 
420 



<210> 74 
<211> 5860 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Plasmid 
<400> 74 

cccggtacca cgcgtcccag tggctgagac gcatccgcta aagccccagg aaccctgtgc 60 
agaaagaaaa cactcctctg gctaggtaga cacagtttat aaaggtagag ttgagcgggt 120 
aactgtcagc acgtagatcg aaaggtgcac aaaggtggcc ctggtcgtac agaaatatgg 180 



cggttcctcg cttgagagtg cggaacgcat tagaaacgtc gctgaacgga tcgttgccac 240 
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caagaaggct 


ggaaatgatg 


tcgtggttgt 


ctgctccgca 


atgggagaca 


ccacggatga 


300 


acttctagaa 


cttgcagcgg 


cagtgaatcc 


cgttccgcca 


gctcgtgaaa 


tggatatgct 


360 


cctgactgct 


ggtgagcgta 


tttctaacgc 


tctcgtcgcc 


atggctattg agtcccttgg 


420 


cgcagaagcc 


caatctttca 


cgggctctca 


ggctggtgtg 


ctcaccaccg 


agcgccacgg 


480 


aaacgcacgc 


attgttgatg 


tcactccagg 


tcgtgtgcgt 


gaagcactcg atgagggcaa 


540 


gatctgcatt 


gttgctggtt 


tccagggtgt 


taataaagaa 


acccgcgatg tcaccacgtt 


600 


gggtcgtggt 


ggttctgaca 


ccactgcagt 


tgcgttggca 


gctgctttga acgctgatgt 


660 


gtgtgagatt 


tactcggacg 


ttgacggtgt 


gtataccgct 


gacccgcgca 


tcgttcctaa 


720 


tgcacagaag 


ctggaaaagc 


tcagcttcga 


agaaatgctg 


gaacttgctg 


ctgttggctc 


780 


caagattttg 


gtgctgcgca 


gtgttgaata 


cgctcgtgca 


ttcaatgtgc 


cacttcgcgt 


840 


acgctcgtct 


tatagtaatg 


atcccggcac 


tttgattgcc 


ggctctatgg aggatattcc 


900 


tgtggaagaa 


gcagtcctta 


ccggtgtcgc 


aaccgacaag 


tccgaagcca 


aagtaaccgt 


960 


tctgggtatt 


tccgataagc 


caggcgaggc 


tgcgaaggtt 


ttccgtgcgt 


tggctgatgc 


1020 


agaaatcaac 


attgacatgg 


ttctgcagaa 


cgtctcttct 


gtagaagacg 


gcaccaccga 


1080 


catcatcttc 


acctgccctc 


gttccgacgg 


ccgccgcgcg 


atggagatct 


tgaagaagct 


1140 


tcaggttcag 


ggcaactgga 


ccaatgtgct 


ttacgacgac 


caggtcggca 


aagtctccct 


1200 


cgtgggtgct 


ggcatgaagt 


ctcacccagg 


tgttaccgca 


gagttcatgg aagctctgcg 


1260 


cgatgtcaac 


gtgaacatcg 


aattgatttc 


cacctctgag 


attcgtattt 


ccgtgctgat 


1320 


ccgtgaagat 


gatctggatg 


ctgctgcacg 


tgcattgcat 


gagcagttcc 


agctgggcgg 


1380 


cgaagacgaa 


gccgtcgttt 


atgcaggcac 


cggacgctaa 


agttttaaag gagtagtttt 


1440 


acaatgacca 


ccatcgcagt 


tgttggtgca 


accggccagg 


tcggccaggt 


tatgcgcacc 


1500 


cttttggaag 


agcgcaattt 


cccagctgac 


acfcgttcgtt 


tctttgcttc 


cccacgttcc 


1560 


gcaggccgta 


agattgaatt 


cgtcgacatc 


gatgctcttc 


tgcgttaatt 


aacaattggg 


1620 


atcctctaga 


cccgggattt 


aaatcgctag 


cgggctgcta 


aaggaagcgg 


aacacgtaga 


1680 


aagccagtcc 


gcagaaacgg 


tgctgacccc 


ggatgaatgt 


cagctactgg 


gctatctgga 


1740 


caagggaaaa 


cgcaagcgca 


aagagaaagc 


aggtagcttg 


cagtgggctt 


acatggcgat 


1800 


agctagactg 


ggcggtttta 


tggacagcaa 


gcgaaccgga 


attgccagct 


ggggcgccct 


1860 


ctggtaaggt 


tgggaagccc 


tgcaaagtaa 


actggatggc 


tttcttgccg 


ccaaggatct 


1920 


gatggcgcag 


gggatcaaga 


tctgatcaag 


agacaggatg 


aggatcgttt 


cgcatgattg 


1980 


aacaagatgg 


attgcacgca 


ggttctccgg 


ccgcttgggt 


ggagaggcta 


ttcggctatg 


2040 


actgggcaca 


acagacaatc 


ggctgctctg 


atgccgccgt 


gttccggctg 


tcagcgcagg 


2100 
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ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg 
aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg 
ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg caggatctcc 
tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca atgcggcggc 
tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat cgcatcgagc 
gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac gaagagcatc 
aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg 
atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa aatggccgct 
tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag gacatagcgt 
tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc 
tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt 
tcttctgagc gggactctgg ggttcgaaat gaccgaccaa gcgacgccca acctgccatc 
acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccacgc 
tagcggcgcg ccggccggcc cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc 
gcatcaggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 
aggtcgttcg ctccaa$ctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaaggccg 
gccgcggccg ccatcggcat tttcttttgc gtttttattt gttaactgtt aattgtcctt 
gttcaaggat gctgtctttg acaacagatg ttttcttgcc tttgatgtrtc agcaggaagc 
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2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
33O0 
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tcggcgcaaa cgttgatfcgt 
tcacgacatt gtttcctttc 
cgttaggatc aagatccatt 
cagttaaaga attagaaaca 
tcgtcatttt tgatccgcgg 
cgttcgcgcg ttcaatttca 
ttttcagtgt gtaatcatcg 
ccgtgcgttt tttatcgctt 
ttttgccata gtatgctttg 
cagtgtttgc ttcaaatact 
tcagcgtatg gttgtcgcct 
gatacgtttt tccgtcaccg 
aagagctgtc tgatgctgat 
gtttaccgga gaaatcagtg 
aacctgacca ttcttgtgtt 
tgtctttaaa gacgcggcca 
gatagaacat gtaaatcgat 
cgatgtggta gccgtgatag 
cccaaacgtc caggcctttt 
aaacttgata tttttcattt 
tatgggaaat gccgtatgtt 
gagttgcgcc tcctgccagc 
actttttgat gttcatcgtt 
ttccagccct cctgtttgaa 
tatgtaaggg gtgacgccaa 
ctttatcagt aacaaacccg 
tggattgcaa ctggtctatt 
gactacgggc ctaaagaact 
tagtttctgt tgcatgggca 
tatctcattt cactaaataa 
gcggccgctc gatttaaatc 
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ttgtctgcgt 

gcttgaggta 

tttaacacaa 

taaccaagca 

gagtcagtga 

tctgttactg 

tttagctcaa 

tgcagaagtt 

ttaaataaag 

aagtatttgt 

gagctgtagt 

tcaaagattg 

acgttaactt 

tagaataaac 

tggtctttta 

gcgtttttcc 

gtgtcatccg 

tttgcgacag 

gcagaagaga 

ttttgctgtt 

tccttatatg 

agtgcggtag 

catgtctcct 

gatggcaagt 

agtatacact 

cgcgatttac 

ttcctctttt 

aaaaaatcta 

taaagttgcc 

tagtgaacgg 

tcgagaggcc 



agaatcctct 
cagcgaagtg 
ggccagtttt 
tgtaaatatc 
acaggtacca 
tgttagatgc 
tcataccgag 
tttgactttc 
attcttcgcc 
ggcctttatc 
tgccttcatc 
atttataatc 
gtgcagttgt 
ggatttttcc 
ggatagaatc 
agctgtcaat 
catttttagg 
tgccgtcagc 
tatttttaat 
cagggatttg 
gcttttggtt 
taaaggttaa 
tttttatgta 
tagttacgca 
ttgcccttta 
ttttcgacct 
gtttgataga 
tctgtttctt 
tttttaatca 
caggtatatg 
tgacgtcggg 



gtttgtcata 
tgagtaagta 
gttcagcggc 
gttagacgta 
tttgccgttc 
aatcagcggt 
agcgccgttt 
ttgacggaag 
ttggtagcca 
ttctacgtag 
gatgaactgc 
ctctacaccg 
cagtgtttgt 
gtcagatgta 
atttgcatcg 
agaagtttcg 
atctccggct 
gttttgtaat 
tgtggacgaa 
cagcatatca 
cgtttctttc 
tactgttgct 
ctgtgttagc 
caataaaaaa 
cacattttag 
cattctatta 
aaatcataaa 
ttcattctct 
caattcagaa 
tgatgggtta 



tagcttgtaa 
aaggttacat 
ttgtatgggc 
atgccgtcaa 
attttaaaga 
ttcatcactt 
gctaactcag 
aatgatgtgc 
tcttcagttc 

tgaggatctc 

tgtacatttt 
ttgatgttca 
ttgccgtaat 
aatgtggctg 
aatttgtcgc 
ccgacttttt 
aatgcaaaga 
ggccagctgt 
tcaaattcag 
tggcgtgtaa 
gcaaacgctt 
tgttttgcaa 
ggtctgcttc 
agacctaaaa 
gtcttgcctg 
gactctcgtt 
aggatttgca 
gtatttttta 
aatatcataa 
aaaaggatcg 
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5160 
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<210> 75 
<211> 31 
<212> DNA 

<213> Kunstliche Seguenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz:PCR primer 
<400> 75 

gagaggatcc ggaaggtgaa tcgaatttcg g 



<210> 76 
<211> 40 
<212> DNA 

<213> Kunstliche Seguenz 
<220> 

<223> Besclireibung der kunstlichen Sequenz : PCR primer 
<400> 76 

ctattgctgt cggcgctcat gattctccaa aaataatcgc 40 

<210> 77 
<211> 20 
<212> DMA 

<223> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: PCR primer 
<400> 77 

atgagcgccg acagcaatag 20 

<210> 78 
<211> 29 
<212> DMA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: PCR primer 
<400> 78 

gaactctaga tcagaacgcc gccacggac 29 

<210> 79 
<211> 6591 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :Plasmid 
<400> 79 

gatccggaag gtgaatcgaa tttcggggct ttaaagcaaa aatgaacagc ttggtotata 60 
gtggctaggt accctttttg ttttggacac atgtagggtg gccgaaacaa agtaatagga 120 
caacaacgct cgaccgcgat tatttttgga gaatcatgag cgccgacagc aatagcaccg iso 
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acgccgatcc 


gaccgcgcat 


tggtcgttcg 


aaaccaaaca 


gatacacgct 


ggtcagcacc 


240 


ctgatccgac 


caccaacgcc 


cgggctctgc 


cgatctatgc gaccacgtcg tacaccttcg 


300 


acgacaccgc 


gcacgccgcc 


gccctgttcg 


gactggaaat 


tccgggcaat 


atctacaccc 


360 


ggatcggcaa 


ccccaccacc 


gacgtcgtcg 


agcagcgcat 


cgccgcgctc 


gagggcggtg 


420 


tggccgcgct 


gttcctgtcg 


tcggggcagg 


ccgcggagac 


gttcgccatc 


ttgaacctgg 


480 


ccggcgcggg 


cgatcacatc 


gtgtccagcc 


cgcgcctgta 


cggcggcacc 


tacaacctgt 


540 


tccactattc 


gctggccaag 


ctcggcatcg 


aggtcagctt 


cgtcgacgat 


ccggacgatc 


600 


tggacacctg 


gcaggcggcg 


gtacggccca 


acaccaaggc 


gttcttcgcc 


gagaccatct 


660 


ccaacccgca 


gatcgacctg 


ctggacaccc 


cggcggtttc 


cgaggtcgcc 


catcgcaacg 


720 


gggtgccgtt 


gatcgtcgac 


aacaccatcg 


ccacgccata 


cctgatccaa 


ccgttggccc 


780 


agggcgccga 


catcgtcgtg 


cattcggcca 


ccaagtacct 


gggcgggcac 


ggtgccgcca 


840 


tcgcgggtgt 


gatcgtcgac 


ggcggcaact 


tcgattggac 


ccagggccgc 


ttccccggct 


900 


tcaccacccc 


cgaccccagc 


taccacggcg 


tggtgttcgc 


cgagctgggt 


ccaccggcgt 


960 


ttgcgctcaa 


agctcgagtg 


cagctgctcc 


gtgactacgg 


ctcggcggct 


tcgccgttca 


1020 


acgcgttctt 


ggtggcgcag 


ggtctggaaa 


cgctgagcct 


gcggatcgag 


cggcacgtcg 


1080 


ccaacgcgca 


gcgcgtcgcc 


gagttcctgg 


ccgcccgcga 


cgacgtgctt 


tcggtcaact 


1140 


atgcggggct 


gccctcctcg 


ccctggcatg 


agcgggccaa 


gaggctggcg 


cccaagggaa 


1200 


ccggggccgt 


gctgtccttc 


gagttggccg 


gcggcatcga ggccggcaag gcattcgtga 


1260 


acgcgttgaa 


gctgcacagc 


cacgtcgcca 


acatcggtga cgtgcgctcg ctggtgatcc 


1320 


acccggcatc 


gaccactcat 


gcccagctga 


gcccggccga 


gcagctggcg 


accggggtca 


1380 


gcccgggcct 


ggtgcgtttg 


gctgtgggca 


tcgaaggtat 


cgacgatatc 


ctggccgacc 


1440 


tggagcttgg 


ctttgccgcg 


gcccgcagat 


tcagcgccga 


cccgcagtcc 


gtggcggcgt 


1500 


tctgatctag 


acccgggatt 


taaatcgcta 


gcgggctgct 


aaaggaagcg 


gaacacgtag 


1560 


aaagccagtc 


cgcagaaacg 


gtgctgaccc 


cggatgaatg 


tcagctactg 


ggctatctgg 


1620 


acaagggaaa 


acgcaagcgc 


aaagagaaag 


caggtagctt 


gcagtgggct 


tacatggcga 


1680 


tagctagact 


gggcggtttt 


atggacagca 


agcgaaccgg 


aattgccagc 


tggggcgccc 


1740 


tctggtaagg 


ttgggaagcc 


ctgcaaagta 


aactggatgg 


ctttcttgcc 


gccaaggatc 


1800 


tgatggcgca 


ggggatcaag 


atctgatcaa 


gagacaggat 


gaggatcgtt 


tcgcatgatt 


1860 


gaacaagatg 


gattgcacgc 


aggttctccg 


gccgcttggg 


tggagaggct 


attcggctat 


1920 


gactgggcac 


aacagacaat 


cggctgctct 


gatgccgccg 


tgttccggct 


gtcagcgcag 


1980 


gggcgcccgg 


ttctttttgt 


caagaccgac 


ctgtccggtg 


ccctgaatga 


actgcaggac 


2040 
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gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc tgtgctcgac 2100 

gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg gcaggatctc 2160 

ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc aatgcggcgg 2220 

ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca tcgcatcgag 2280 

cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga cgaagagcat 2340 

caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc cgacggcgag 2400 

gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga aaatggccgc 2460 

ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca ggacatagcg 2520 

ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg cttccfccgtg 2580 

ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct tcttgacgag 2640 

ttcttctgag cgggactctg gggttcgaaa tgaccgacca agcgacgccc aacctgccat 2700 

cacgagattt cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc 2760 

gggacgccgg ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacg 2820 

ctagcggcgc gccggccggc ccggtgtgaa ataccgcaca gatgcgtaag gagaaaatac 2880 

cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 2940 

cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 3000 

aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 3 060 

gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 3120 

tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 3180 

agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 3240 

ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 3300 

taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 3360 

gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 3420 

gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc . 3480 

ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 3540 

ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 3600 

gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 3660 

caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 3720 

taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaaggcc 3780 

ggccgcggcc gcgcaaagtc ccgcttcgtg aaaattttcg tgccgcgtga ttttccgcca 3840 

aaaactttaa cgaacgttcg ttataatggt gtcatgacct tcacgacgaa gtactaaaat 3 900 

tggcccgaat catcagctat ggatctctct gatgtcgogc tggagtccga cgcgctcgat 3 960 
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gctgccgtcg atttaaaaac ggtgatcgga tttttccgag ctctcgatac gacggacgcg 
ccagcatcac gagactgggc cagtgccgcg agcgacctag aaaetctcgfc ggcggatctt 
gaggagctgg ctgacgagct gcgtgctcgg ccagcgccag gaggacgcac agtagtggag 
gatgcaatca gttgcgccta ctgcggtggc ctgattcctc cccggcctga cccgcgagga 
cggcgcgcaa aatattgctc agatgcgtgt cgtgccgcag ccagccgcga gcgcgccaac 
aaacgccacg ccgaggagct ggaggcggct aggtcgcaaa tggcgctgga agtgcgtccc 
ccgagcgaaa ttttggccat ggtcgtcaca gagctggaag cggcagcgag aattatcgcg 
atcgtggcgg tgcccgcagg catgacaaac atcgtaaatg ccgcgtttcg tgtgccgtgg 
ccgcccagga cgtgtcagcg ccgccaccac ctgcaccgaa tcggcagcag cgtcgcgcgt 
cgaaaaagcg cacaggcggc aagaagcgat aagctgcacg aatacctgaa aaatgttgaa 
cgccccgtga gcggtaactc acagggcgtc ggctaacccc cagtccaaac ctgggagaaa 
gcgctcaaaa atgactctag cggattcacg agacattgac acaccggcct ggaaattttc 
cgctgatctg ttcgacaccc atcccgagct cgcgctgcga tcacgtggct ggacgagcga 
agaccgccgc gaattcctcg ctcacctggg cagagaaaat ttccagggca gcaagacccg 
cgacttcgcc agcgcttgga tcaaagaccc ggacacggag aaacacagcc gaagttatac 
cgagttggtt caaaatcgct tgcccggtgc cagtatgttg ctctgacgca cgcgcagcac 
gcagccgtgc ttgtcctgga cattgatgtg ccgagccacc aggccggcgg gaaaatcgag 
cacgtaaacc ccgaggtcta cgcgattttg gagcgctggg cacgcctgga aaaagcgcca 
gcttggatcg gcgtgaatcc actgagcggg aaatgccagc tcatctggct cattgatccg 
gtgtatgccg cagcaggcat gagcagcccg aatatgcgcc tgctggctgc aacgaccgag 
gaaatgaccc gcgttttcgg cgctgaccag gctttttcac ataggctgag ccgtggccac 
tgcactctcc gacgatccca gccgtaccgc tggcatgccc agcacaatcg cgtggatcgc 
ctagctgatc ttatggaggt tgctcgcatg atctcaggca cagaaaaacc taaaaaacgc 
tatgagcagg agttttctag cggacgggca cgtatcgaag cggcaagaaa agccactgcg 
gaagcaaaag cacttgccac gcttgaagca agcctgccga gcgccgctga agcgtctgga 
gagctgatcg acggcgtccg tgtcctctgg actgctccag ggcgtgccgc ccgtgatgag 
acggcttttc gccacgcttt gactgtggga taccagttaa aagcggctgg tgagcgccta 
aaagacacca agggtcatcg agcctacgag cgtgcctaca ccgtcgctca ggcggtcgga 
ggaggccgtg agcctgatct gccgccggac tgtgaccgcc agacggattg gccgcgacgt 
gtgcgcggct acgtcgctaa aggccagcca gtcgtccctg ctcgtcagac agagacgcag 
agccagccga ggcgaaaagc tctggccact atgggaagac gtggcggtaa aaaggccgca 
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gaacgctgga 


aagacccaaa 


cagtgagtac gcccgagcac agcgagaaaa actagctaag 


5880 


tccagtcaac 


gacaagctag gaaagctaaa ggaaatcgct tgaccattgc aggttggttt 


5940 


atgactgttg 


agggagagac 


tggctcgtgg ccgacaatca atgaagctat gtctgaattt: 


6000 


agcgtgtcac 


gtcagaccgt gaatagagca cttaaggtct gcgggcattg aacttccacg 


6060 


aggacgccga 


aagcttccca 


gtaaatgtgc catctcgtag gcagaaaacg gttcccccgt 


6120 


agggtctctc 


tcttggcctc 


ctttctaggt cgggctgatt gctcttgaag ctctctaggg 


6X80 


gggctcacac 


cataggcaga 


taacgttccc caccggctcg cctcgtaagc gcacaaggac 


6240 


tgctcccaaa 


gatcttcaaa gccactgccg cgactgcctt cgcgaagcct tgccccgcgg 
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aaatttcctc 


caccgagttc 


gtgcacaccc ctatgccaag cttctttcac cctaaafcfccg 
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agagattgga 


ttcttaccgt 


ggaaattctt cgcaaaaatc gtcccctgat cgccctfcgcg 
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acgttggcgt 


cggtgccgct 


ggttgcgctt ggcttgaccg acttgatcag cggccgctcg 


6480 


atttaaatct 


cgagaggcct 


gacgtcgggc ccggtaccac gcgtcatatg actagfcfccgg 


6540 


acctagggat 


atcgtcgaca 


tcgatgctct tctgcgttaa ttaacaattg g 
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